
Le mardi après-midi, Anthropic a lancé Claude Plays Pokémon sur Twitch, un stream en direct du tout dernier modèle d'IA d'Anthropic, Claude 3.7 Sonnet, jouant à Pokémon Rouge. C'est devenu une sorte d'expérience fascinante, mettant en évidence les capacités de la technologie IA d'aujourd'hui et les réactions des gens à leur égard.
Les chercheurs en IA ont utilisé toutes sortes de jeux vidéo, de Street Fighter à Pictionary, pour tester de nouveaux modèles - souvent plus pour le plaisir que pour l'utilité. Mais Anthropic a déclaré que Pokémon s'est avéré être une référence utile pour Claude 3.7 Sonnet, qui peut efficacement "penser" aux sortes de puzzles que le jeu contient.
Comme l'o3-mini d'OpenAI et le R1 de DeepSeek, Claude 3.7 Sonnet peut "raisonner" à travers des défis difficiles, comme jouer à un jeu vidéo conçu pour les enfants. Alors que le prédécesseur non raisonnement du modèle, Claude 3.5 Sonnet, a échoué dès le tout début de Pokémon Rouge - en sortant de la maison du joueur à Bourg Palette - Claude 3.7 Sonnet a réussi à remporter trois badges de chef d'arène.

Le tout nouveau Claude rencontre cependant des problèmes. Des heures après le début du stream Twitch, le modèle a été arrêté par un mur de pierre, qu'il n'a pas pu traverser quoi qu'il fasse.
Un utilisateur de Twitch a ainsi résumé la situation : "qui gagnerait, une IA informatique avec des milliers d'heures consacrées à sa programmation, ou 1 mur de pierre ?"
Finalement, Claude a réalisé qu'il pouvait contourner le mur.
D'une part, il est frustrant de regarder Claude traverser Pokémon Rouge à la vitesse d'un Ramoloss, raisonant chaque étape avec une contemplation exaspérante. Pourtant, c'est aussi étrangement captivant. À gauche du stream montre le "processus de pensée" de Claude, tandis que la droite montre le gameplay en temps réel.
À un moment donné, Claude a tenté de localiser le Professeur Chen dans son laboratoire, mais s'est retrouvé perdu, car d'autres PNJ étaient présents dans la scène.
"Je remarque qu'un nouveau personnage est apparu en dessous de moi - un personnage aux cheveux noirs et portant ce qui semble être un manteau blanc aux coordonnées (2, 10)," a écrit Claude. "Cela pourrait être le Professeur Chen ! Allons en bas et lui parler."
Claude a ensuite parlé par erreur à un autre PNJ que le Professeur - un PNJ avec lequel le modèle avait déjà parlé plusieurs fois auparavant. Certains des milliers de spectateurs dans le chat Twitch ont commencé à s'impatienter. D'autres, en particulier ceux qui regardaient le stream depuis plus de quelques minutes, étaient moins inquiets.
"Calm down les gars," a écrit une personne dans le chat. "Avant nous sommes entrés et sortis du laboratoire de Chen comme 10 fois avant de comprendre comment avancer."

Pour les utilisateurs de Twitch de longue date, le format du stream d'Anthropic pourrait sembler nostalgique. Il y a plus d'une décennie, des millions de personnes ont tenté de jouer à Pokémon Rouge en même temps dans une expérience sociale en ligne inédite appelée Twitch Plays Pokémon. Chaque utilisateur pouvait contrôler le personnage du joueur via le chat Twitch, ce qui entraînait un gameplay chaotique et prévisible.
Certains chercheurs en IA ont cité Twitch Plays Pokémon comme une inspiration pour leur travail. En octobre 2023, l'ingénieur logiciel basé à Seattle Peter Whidden a publié une vidéo sur YouTube détaillant comment il a entraîné un algorithme d'apprentissage par renforcement à jouer à Pokémon. Son IA a passé plus de 50 000 heures à jouer au jeu avant d'apprendre à le naviguer avec succès. L'un des défis était que l'IA préférait admirer le paysage pixelisé plutôt que de jouer réellement.
Les "reconstitutions" de Twitch Plays Pokémon alimentées par l'IA comme celles de Whidden et d'Anthropic sont divertissantes, mais un peu aigres-douces en même temps. Le stream original a été un moment crucial de l'histoire de Twitch car il a rassemblé les gens de manière inattendue. Tout le monde était dans la même équipe, travaillant ensemble pour amener le personnage joueur à arrêter de tourner en rond et à progresser réellement dans le jeu.
En 2025, il semble que nous ne sommes plus des coéquipiers, mais des spectateurs, regardant un modèle d'IA essayer de jouer à un jeu que beaucoup d'entre nous maîtrisions à cinq ans. C'est un microcosme motivé par l'IA d'une tendance plus large : nos expériences en ligne passent d'activités partagées et communales à des activités plus solitaires.