Adaptive Mode : routage intelligent de modèle

Le bon modèle IA pour chaque tâche,
choisi automatiquement, avant l'envoi

Adaptive Mode lit le prompt que tu t'apprêtes à envoyer et suggère le modèle le plus économique pour la tâche. Une correction de typo ou une traduction part vers un modèle léger et peu cher. Une grosse refacto ou une conception d'architecture part vers un flagship. Tu ne paies que la puissance dont tu as vraiment besoin.

Les petits modèles coûtent une fraction du flagship. Calibrer le modèle sur chaque tâche, c'est brûler beaucoup moins de ton budget par tâche, donc faire plus de tâches par jour sans buter sur une limite d'usage. Un clic applique la suggestion et tu continues à travailler.

Télécharger AgentsRoom Voir comment ça marche

Adaptive Mode

Analyse de la tâche

Traduire une chaîne d'interface

Idéal

Haiku

Sonnet

Opus

Coût par tâchePlus de tâches par jour

Adaptive Mode associe chaque tâche au modèle le moins cher capable de bien la faire : Haiku pour le travail léger, Sonnet pour le travail équilibré, Opus pour le travail lourd. Moins de coût par tâche, plus de tâches par jour.

Voici le problème d'argent quand on fait tourner des agents de code IA. Chaque modèle a un prix, et l'écart entre le moins cher et le flagship est énorme. Claude Opus est le modèle le plus capable, et le plus cher. Claude Haiku est le moins cher. Claude Sonnet est au milieu. La plupart des gens choisissent un seul modèle et n'y touchent plus, donc soit ils sous-dimensionnent leurs tâches difficiles, soit, bien plus souvent, ils surpaient leurs tâches faciles.

Pense à ce que tu demandes vraiment à un agent dans une journée. Corriger une typo. Renommer une variable. Traduire une chaîne d'interface. Écrire un petit test unitaire. Résumer un document. Rien de tout ça n'a besoin d'un flagship. Si tu lances tout ça sur Opus, tu brûles ton budget d'usage bien plus vite que nécessaire, pour un résultat identique. Ce gaspillage est invisible, et c'est exactement pour ça qu'il s'accumule.

Adaptive Mode comble cet écart. Avant l'envoi de ton premier message, il lit ton brouillon, évalue la vraie difficulté de la tâche, et suggère le modèle le moins cher de la gamme de ton provider qui sait quand même bien faire le travail. Les modèles costauds restent réservés au travail qui le mérite : architecture, audits de sécurité, grosses refactos. Tout le reste part vers un modèle qui coûte une fraction du prix.

Pourquoi calibrer le modèle sur la tâche

Arrête de surpayer les tâches faciles. Un flagship sur une correction de typo, c'est de l'argent jeté par les fenêtres. Adaptive Mode oriente le travail léger vers un modèle léger, donc chaque tâche triviale coûte une fraction de ce qu'elle coûterait sur le haut de gamme.

Garde le modèle puissant pour les problèmes durs. Calibrer ne veut pas dire toujours prendre le moins cher. Quand la tâche est une conception système ou un audit de sécurité, Adaptive Mode te dit de monter en gamme, pour que le travail qui demande de la profondeur l'obtienne vraiment.

Plus de tâches par jour sur le même forfait. Moins de budget dépensé par tâche, c'est buter sur ta limite d'usage plus tard. Sur une journée entière et une flotte d'agents en parallèle, les économies s'additionnent en débit réel supplémentaire.

Zéro friction dans le workflow. La suggestion apparaît dans une petite pastille au-dessus du composer avant l'envoi. Un clic l'applique. Pas de menu à fouiller, pas de devinette manuelle sur le bon modèle, pas de ralentissement.

L'économie : consommer moins, faire plus

Mêmes agents, même forfait. La différence, c'est combien de budget chaque tâche dévore.

Un seul modèle pour tout

: Chaque tâche tourne sur le modèle que tu as laissé sélectionné.
: Un flagship sur une typo ou une traduction coûte plusieurs fois trop cher.
: Ton budget d'usage se vide vite sur du travail qui n'a jamais eu besoin de cette puissance.
: Tu butes sur la limite d'usage plus tôt dans la journée et les agents calent.
: Changer de modèle à la main est pénible, alors personne ne le fait.

Adaptive Mode activé

: Chaque tâche est associée au modèle le moins cher capable de bien la faire.
: Le travail léger part vers un modèle léger et coûte une fraction du prix.
: Le flagship est gardé pour les refactos, les audits et l'architecture.
: Moins de budget par tâche, donc plus de tâches avant toute limite d'usage.
: Un clic applique le bon modèle, donc le calibrage se fait vraiment.

Le routage lui-même est quasi gratuit : un petit modèle rapide fait l'analyse pour bien moins d'un centime, puis s'efface.

Comment Adaptive Mode fonctionne, étape par étape

Il s'exécute une fois, avant ton premier message, et ne te gêne jamais.

Tu commences à taper ton prompt

Ouvre une nouvelle conversation avec n'importe quel agent et écris ce que tu veux faire. Adaptive Mode ne regarde que les conversations toutes neuves, donc il n'interrompt jamais une session déjà lancée.

Il lit la tâche et l'analyse

Quand ton brouillon est assez consistant et que tu marques une pause, Adaptive Mode envoie le début de ton brouillon à un petit modèle de routage rapide qui évalue l'exigence de la tâche.

Une suggestion de modèle apparaît

Une pastille surgit au-dessus du composer : « Passer à Haiku », « Passer à Sonnet » ou « Passer à Opus », selon le choix le plus économique. Si ton modèle actuel est déjà le meilleur, il te le dit à la place.

Tu l'appliques en un clic

Clique sur la pastille et le modèle est appliqué. Si une session tourne déjà, Adaptive Mode la bascule à chaud. Le choix est aussi enregistré sur l'agent, donc le prochain lancement démarre sur le bon modèle.

Ou recalcule, ou ignore

Reformulé ton prompt ? Appuie sur rafraîchir pour recalculer la recommandation pour le nouveau brouillon. Content de ton modèle actuel ? Ignore la pastille et envoie. Tu gardes le contrôle de chaque choix.

Ensuite, il reste discret

Adaptive Mode suggère une fois par conversation, donc il ne te harcèle jamais et ne dépense pas en douce ton quota mensuel pendant que tu continues d'éditer. Il fait son travail, puis disparaît.

Routage de modèle indépendant du provider

Adaptive Mode lit la gamme de modèles du provider que tu utilises et recommande dans ce catalogue. Il n'est lié à aucun éditeur en particulier.

Claude

Route entre Haiku, Sonnet et Opus. Haiku pour les corrections rapides, les renommages, les traductions, les petits tests et les résumés. Sonnet pour les revues de pull request, les nouveaux endpoints, le debug complexe et les refactos. Opus pour l'architecture système, les audits de sécurité, les grosses refactos legacy et le travail de performance en profondeur.

Codex

Route dans la gamme Codex, du modèle mini rapide et peu cher pour les petits bugs et les questions rapides, au modèle équilibré par défaut pour les features de bout en bout et les tests, jusqu'au modèle de raisonnement flagship pour la conception système complexe et la revue de code en profondeur.

Gemini

Route entre le modèle Gemini rapide pour les petites corrections, les traductions et les résumés, et le modèle Gemini capable pour implémenter des features, debugger et faire de l'analyse plus poussée.

Autres providers

Pour tout provider, Adaptive Mode retombe sur une règle simple : le modèle le moins cher pour le travail léger, un modèle équilibré pour le travail normal, le modèle le plus capable pour le travail difficile. Ajoute un provider et il route dans les modèles de ce provider.

Compatible avec ton provider

Claude, Codex, Gemini et plus. Les suggestions sont validées contre les modèles réellement proposés par ce provider, donc tu n'obtiens jamais une recommandation que tu ne peux pas appliquer.

Seulement ton brouillon, seulement au besoin

Pour calculer une suggestion, le début de ton brouillon est envoyé aux serveurs AgentsRoom. Ça tourne une fois par conversation, sur une conversation neuve, et uniquement quand Adaptive Mode est activé.

Activé par défaut, désactivé en un geste

Adaptive Mode est activé d'office parce que calibrer le modèle fait économiser dès le départ. Désactive-le quand tu veux dans les réglages si tu préfères choisir les modèles toi-même.

FAQ

C'est quoi Adaptive Mode dans AgentsRoom ?

Adaptive Mode, c'est le routage intelligent de modèle pour tes agents de code IA. Avant l'envoi de ton premier message, il lit ton prompt et suggère le modèle le plus économique de la gamme de ton provider qui sait quand même bien faire la tâche. Une tâche légère reçoit un modèle léger et peu cher ; une tâche lourde reçoit un flagship. Le but est simple : arrêter de surpayer avec un modèle puissant un travail qui n'en a pas besoin.

Comment Adaptive Mode choisit-il un modèle ?

Il envoie le début de ton brouillon à un petit modèle de routage rapide guidé par des exemples reliant les types de tâches aux niveaux de modèle. Il renvoie ensuite le modèle le moins cher qui convient à la tâche, validé contre les modèles réellement proposés par ton provider. Si ton modèle actuel est déjà le meilleur choix, il indique que le modèle est optimal plutôt que de pousser un changement.

Concrètement, en quoi ça me fait économiser ?

Les modèles moins chers coûtent une fraction du flagship pour la même tâche simple. Si tu fais tes corrections de typo, tes renommages, tes traductions et tes petits tests sur le modèle haut de gamme, tu brûles ton budget d'usage bien plus vite que nécessaire. Adaptive Mode oriente ce travail léger vers un modèle léger, donc chaque tâche coûte moins et tu peux en faire plus avant de buter sur une limite d'usage. Sur une journée et beaucoup d'agents en parallèle, ces économies s'additionnent.

Quels modèles peut-il suggérer ?

Ceux que propose ton provider. Sur Claude, c'est Haiku, Sonnet et Opus. Sur Codex, ça couvre le modèle mini rapide, le modèle équilibré par défaut et le modèle de raisonnement flagship. Sur Gemini, ça couvre le modèle rapide et le modèle capable. Pour les autres providers, ça retombe sur le moins cher, l'équilibré et le plus capable. Adaptive Mode lit la liste de modèles en direct, donc il recommande toujours un modèle que tu peux vraiment lancer.

Est-ce qu'il change le modèle automatiquement ?

Non. Adaptive Mode se contente de suggérer. Tu appliques le changement d'un seul clic sur la pastille. Si une session tourne déjà, il bascule le modèle à chaud ; dans tous les cas, le choix est enregistré sur l'agent pour que le prochain lancement démarre sur le bon modèle. Tu peux aussi ignorer la suggestion et garder ton modèle actuel.

Quand la suggestion apparaît-elle ?

Sur une conversation toute neuve, après que tu as tapé un prompt consistant et marqué une pause. Elle tourne une fois par conversation, donc elle n'interrompt jamais une session en cours et ne dépense pas en douce ton quota mensuel pendant que tu continues d'éditer.

Puis-je recalculer la suggestion ?

Oui. Si tu réécris ton prompt, appuie sur le bouton rafraîchir de la pastille pour recalculer la recommandation pour le nouveau brouillon. Un recalcul manuel utilise une de tes suggestions mensuelles, donc il est là quand tu en as besoin sans tourner à chaque frappe.

Mon prompt est-il privé ?

Pour calculer une suggestion, seul le début de ton brouillon est envoyé aux serveurs AgentsRoom, une fois par conversation, et uniquement quand Adaptive Mode est activé. Tu peux désactiver entièrement la fonctionnalité dans les réglages si tu préfères choisir les modèles toi-même.

Adaptive Mode marche avec Codex et Gemini, pas seulement Claude ?

Oui. Adaptive Mode est indépendant du provider. Il lit le catalogue de modèles du provider que l'agent utilise et recommande dans ce catalogue, que ce soit Claude, Codex, Gemini ou un autre provider supporté. La commande de changement de modèle est construite pour le provider sur lequel tu es.

Comment activer ou désactiver Adaptive Mode ?

Il est activé par défaut, parce que calibrer le modèle fait économiser dès le départ. Tu peux le désactiver ou le réactiver quand tu veux dans les réglages d'AgentsRoom, sous Adaptive Model.

Va bien avec

Consommation de tokens Claude Code

Vois la consommation de tokens et le coût par session en temps réel. Va de pair avec Adaptive Mode : route malin, puis regarde les économies tomber.

Délégation d'agent

Un agent dev confie un test à un agent QA moins cher via MCP. Même idée qu'Adaptive Mode, appliquée à des agents entiers.

Multi-provider

Fais tourner Claude, Codex et Gemini côte à côte. Adaptive Mode route dans le provider sur lequel chaque agent se trouve.

Statistiques de projet

Temps, prompts, tokens et coût par projet et par agent. La vue tableau de bord du budget qu'Adaptive Mode t'aide à protéger.

Suivi du statut des agents

Statut en direct de chaque agent sur chaque projet, pour toujours savoir qui travaille et qui a besoin de toi.

Restaurer la session

Quitte et reviens avec chaque agent, terminal et sélection de modèle exactement là où tu les as laissés.

Arrête de payer une puissance de modèle IA dont tu n'as pas besoin

Télécharge AgentsRoom et laisse Adaptive Mode choisir le modèle le plus économique pour chaque tâche. Des modèles légers pour le travail léger, des flagships pour les problèmes durs, moins de budget brûlé par tâche, plus de tâches livrées par jour.

GratuitTélécharger AgentsRoom

App companion : suivez vos agents en déplacement

Utilisez Claude, Codex, Gemini CLI ou un autre fournisseur IA.

Installer l'extension

Chrome Web Store

Remontez bugs et demandes directement dans votre backlog public.