Pendant deux ans, le commerce agentique a vécu sur des démos. Des vidéos LinkedIn d'agents qui réservaient un restaurant à San Francisco. Des annonces produit aux contours flous. Des feuilles de route où le « disponible courant 2025 » glissait, trimestre après trimestre, vers un « début 2026 » jamais tenu. 2026 marque une rupture : les premiers déploiements en production sortent du laboratoire et touchent des clients réels, à grande échelle, dans des secteurs où l'erreur coûte cher. Banque, retail, voyage : trois verticales, trois philosophies d'agent, trois manières d'apprivoiser un usage qui force chacune à repenser ses garde-fous.
Tour d'horizon de trois projets que les équipes terrain commencent à documenter publiquement, et de ce qu'ils enseignent à un écosystème encore en train de poser ses standards.
1. Banque : Wells Fargo et l'agent de réclamation client
Une banque retail nord-américaine traite, chaque mois, un volume de réclamations carte qui se compte en centaines de milliers de dossiers. Litiges de transaction, prélèvements contestés, frais perçus comme abusifs, suspicions de fraude : la mécanique est rodée mais coûteuse. Selon plusieurs sources industrielles citées lors de conférences sectorielles début 2026, le coût moyen de traitement d'une réclamation carte simple oscille entre 8 et 22 dollars dans les grandes banques américaines, avec des délais de résolution qui restent un irritant client majeur.
Wells Fargo a positionné publiquement, à plusieurs reprises depuis fin 2024, son intention d'industrialiser des assistants IA sur ce périmètre. La communication officielle du groupe sur Fargo, son assistant client, et sur les usages internes d'IA générative laisse entendre que la qualification et le routage des réclamations figurent parmi les priorités. Les détails opérationnels précis — volumes traités, taux de résolution autonome, pourcentage de cas escaladés — ne font pas l'objet de chiffres publics consolidés à ce stade.
D'après plusieurs sources proches du dossier, l'architecture cible repose sur un agent qui qualifie la réclamation, vérifie l'historique transactionnel, identifie le motif probable, puis propose une issue. Pour une catégorie de cas standards — frais récurrents oubliés après résiliation, prélèvements en double, abonnement non reconnu de faible montant — l'agent peut proposer un remboursement ou un geste commercial dans la limite d'un plafond paramétré. Un responsable transformation IA cité de manière anonyme dans une table ronde de février 2026 évoquait « une part majoritaire de cas standards où l'agent peut formuler une proposition immédiate, sous réserve de validation du client et de logging complet ».
Les limites assumées
Trois garde-fous sont systématiquement mentionnés dans les communications publiques de l'entreprise : un seuil financier au-delà duquel l'humain reprend la main, une liste de motifs sensibles (suspicion de fraude organisée, usurpation d'identité, contentieux en cours) qui force l'escalade immédiate, et une traçabilité intégrale des actions de l'agent. La supervision humaine n'est pas optionnelle : elle est documentée comme un principe d'architecture, et non comme un filet rajouté à la dernière minute.
2. Retail : Walmart et l'agent panier hebdomadaire
Walmart a publiquement présenté, lors de plusieurs événements de 2025 et 2026, sa stratégie « adaptive retail » et ses expérimentations autour d'assistants conversationnels intégrés à l'application et au site. Le groupe a confirmé travailler avec OpenAI sur des intégrations dans le sillage des annonces Stripe ACP et des standards émergents. Les chiffres précis de déploiement — nombre de clients exposés, taux d'adoption, conversion comparée au parcours classique — ne sont pas publics à la date de cet article.
Le scénario phare documenté lors des présentations investisseurs ressemble à un agent « shop with me ». L'utilisateur exprime un besoin en langage naturel — « prépare-moi le panier de la semaine pour quatre personnes, budget 180 dollars, deux enfants végétariens, allergie aux fruits à coque » — et l'agent compose une proposition. Il croise l'historique d'achat, les promotions en cours, les disponibilités en magasin local et la livraison. Il propose un panier complet, justifie ses choix par produit, et permet de substituer chaque ligne d'un geste.
Pourquoi le panier hebdo plutôt que l'achat impulsif
Le choix du cas d'usage n'est pas anodin. Le panier hebdomadaire récurrent présente trois propriétés que les équipes produit valorisent : un volume élevé de répétition (donc beaucoup de signal pour entraîner et mesurer), un risque limité par transaction (un yaourt substitué n'est pas un drame), et une frustration utilisateur connue (le temps passé à reconstituer chaque semaine la même liste avec quelques variations). Selon une source proche du dossier, « le panier hebdo, c'est le cas où l'IA peut faire gagner du temps sans qu'il faille un saut de confiance énorme ».
La métrique scrutée en interne n'est pas le taux de conversion brut, mais le taux de complétion du panier : combien d'utilisateurs qui démarrent une session « shop with me » finissent par valider une commande sans tout refaire à la main. Ce ratio, plus que les ventes incrémentales, dit si l'agent crée vraiment de la valeur ou si l'utilisateur le contourne dès qu'il s'agit de finaliser.
Le contrôle consommateur, condition de survie du modèle
Trois contrôles explicites sont systématiquement présents dans les démos publiques : la possibilité de retirer chaque article d'un clic, l'affichage du prix total avant validation, et la confirmation explicite avant débit. Aucun paiement n'est exécuté sans action utilisateur. Walmart, comme l'ensemble des retailers expérimentant l'agentique, semble avoir compris qu'un seul incident médiatique de « l'agent a commandé sans demander » suffirait à figer le marché grand public pour plusieurs années.
3. Voyage : Expedia et l'agent itinéraire complet
Le voyage est le terrain de jeu le plus exigeant et le plus prometteur de l'agentique. Un itinéraire multi-segments — vol aller, vol retour, hôtel, transferts, parfois location de voiture ou activités — engage facilement plusieurs milliers d'euros, mobilise une dizaine d'acteurs commerciaux différents, et impose une coordination temporelle où la moindre erreur (correspondance trop courte, chambre indisponible à l'arrivée, transfert oublié) gâche l'expérience entière.
Expedia Group a publiquement communiqué, lors d'événements industrie de 2025 et 2026, sur sa vision d'agents capables d'exécuter un voyage de bout en bout. Le groupe collabore notamment avec plusieurs fournisseurs de modèles et participe activement aux discussions sur les protocoles inter-agents. Les annonces presse de juin 2025 puis du début 2026 évoquent un déploiement progressif d'expériences agentiques pour les voyageurs membres du programme, sans préciser de volumétrie consolidée.
Le pattern documenté tient en trois phases. Phase un, exploration : l'utilisateur décrit son projet — « une semaine au Japon mi-octobre pour deux, plutôt nature que ville, budget 4 500 euros tout inclus, vol direct depuis Paris si possible ». L'agent propose plusieurs scénarios chiffrés. Phase deux, affinage : l'utilisateur ajuste, l'agent recompose. Phase trois, exécution : une fois le scénario validé, l'agent réserve l'ensemble des segments en cascade, dans le bon ordre, avec gestion des règles d'annulation et synchronisation des conditions tarifaires.
« Shop for me » plutôt que « shop with me »
C'est ici que le voyage se distingue : on bascule clairement du « shop with me » (assistance à la décision) au « shop for me » (délégation d'exécution). Une fois la validation utilisateur faite sur le scénario consolidé, l'agent agit. Il enchaîne les API des fournisseurs, gère les retries, replanifie si un segment devient indisponible entre la validation et la réservation effective, et notifie l'utilisateur des écarts significatifs avant de débiter.
La métrique-clé n'est ni le panier moyen ni le taux de complétion, mais la satisfaction post-voyage. Un voyage agentique réussi se mesure trois mois après, à la note laissée par le voyageur sur l'ensemble de l'expérience, et à son retour ou non vers le canal agentique pour son prochain projet. C'est une métrique lente, exigeante, qui force l'industrie à raisonner en cohortes plutôt qu'en clics.
4. Quatre constantes qui se dégagent
Au-delà des spécificités sectorielles, quatre invariants reviennent dans tous les déploiements observés :
- Authentification forte de l'agent vis-à-vis du commerçant : l'agent doit prouver qu'il agit au nom d'un utilisateur identifié, et le commerçant doit pouvoir le vérifier. Les standards émergents — MCP côté Anthropic, ACP porté par Stripe et OpenAI, TAP de Visa, Agent Pay de Mastercard, ACF® du côté européen — convergent tous, par des voies différentes, vers cette exigence.
- Paiement sous contrôle utilisateur : aucun débit n'est exécuté sans validation explicite du montant total. Les tokens de paiement délégué intègrent des plafonds, des durées de validité courtes, et une révocabilité instantanée.
- Traçabilité intégrale : chaque action de l'agent est journalisée — qui a décidé quoi, quand, sur la base de quelles informations. Sans audit trail, pas de confiance, et sans confiance, pas de scale.
- Conformité réglementaire intégrée dès la conception : RGPD pour les données utilisateurs, DSP2 pour les paiements en zone euro, et anticipation de l'AI Act dont l'application aux systèmes haut risque prend effet le 2 décembre 2027.
5. Ce qui freine encore
Trois obstacles dominent les conversations entre acteurs en 2026. Le premier est la confiance utilisateur : tant qu'un grand public n'a pas vu fonctionner ses pairs sans accident, l'adoption massive restera lente. Les retailers et plateformes voyage l'ont intégré et investissent autant dans la pédagogie et le design de la transparence que dans la performance brute du modèle.
Le deuxième est le cadre réglementaire européen. L'AI Act, dont l'enforcement pour les systèmes haut risque arrive le 2 décembre 2027, impose une architecture documentée, une supervision humaine, une gestion des biais, et — point central — la désignation d'un Designated Delegated Agent Officer (DDAO) responsable de chaque chaîne agentique en production. Les entreprises qui n'auraient pas formalisé cette gouvernance à 18 mois de l'échéance prennent un risque que peu de directions juridiques sont prêtes à porter.
Le troisième est l'interopérabilité. Un agent qui ne sait dialoguer qu'avec les API maison de son éditeur n'ouvre pas un marché : il enferme l'utilisateur. La convergence des standards — sur l'authentification, le format des intents, la sémantique des actions — est la condition pour que l'écosystème dépasse le stade des silos verticaux.
Conclusion : 2027 pour le scale, 2028 pour le mainstream
Les trois cas évoqués partagent une caractéristique discrète : ils ne sont pas spectaculaires. Pas d'agent autonome qui « vit sa vie », pas de promesse magique de remplacement complet du conseiller, du vendeur ou du concierge. Des projets concrets, périmètres serrés, garde-fous explicites, mesure honnête. C'est précisément ce profil — peu vendeur en démo, robuste en production — qui sortira ou non l'industrie de sa phase pilote.
2027 devrait être l'année du scale : passage des dizaines de milliers d'utilisateurs exposés à des millions, généralisation des standards interopérables, premiers contrôles sérieux de la CNIL et des autorités sectorielles européennes. 2028, si la confiance tient, sera celle où l'agent devient un canal parmi d'autres, ni miracle ni gadget. D'ici là, chaque déploiement raté coûtera plus cher au secteur que dix démos réussies. Mieux vaut quelques cas d'usage solides que cent vidéos LinkedIn.
Recevez Le Brief A-commerce chaque lundi
L'essentiel de la semaine en 5 minutes : protocoles, études, décisions réglementaires.
S'abonner gratuitement →