Le bon modèle IA pour chaque tâche,
choisi automatiquement, avant l'envoi
Adaptive Mode lit le prompt que tu t'apprêtes à envoyer et suggère le modèle le plus économique pour la tâche. Une correction de typo ou une traduction part vers un modèle léger et peu cher. Une grosse refacto ou une conception d'architecture part vers un flagship. Tu ne paies que la puissance dont tu as vraiment besoin.
Les petits modèles coûtent une fraction du flagship. Calibrer le modèle sur chaque tâche, c'est brûler beaucoup moins de ton budget par tâche, donc faire plus de tâches par jour sans buter sur une limite d'usage. Un clic applique la suggestion et tu continues à travailler.
Adaptive Mode associe chaque tâche au modèle le moins cher capable de bien la faire : Haiku pour le travail léger, Sonnet pour le travail équilibré, Opus pour le travail lourd. Moins de coût par tâche, plus de tâches par jour.
Voici le problème d'argent quand on fait tourner des agents de code IA. Chaque modèle a un prix, et l'écart entre le moins cher et le flagship est énorme. Claude Opus est le modèle le plus capable, et le plus cher. Claude Haiku est le moins cher. Claude Sonnet est au milieu. La plupart des gens choisissent un seul modèle et n'y touchent plus, donc soit ils sous-dimensionnent leurs tâches difficiles, soit, bien plus souvent, ils surpaient leurs tâches faciles.
Pense à ce que tu demandes vraiment à un agent dans une journée. Corriger une typo. Renommer une variable. Traduire une chaîne d'interface. Écrire un petit test unitaire. Résumer un document. Rien de tout ça n'a besoin d'un flagship. Si tu lances tout ça sur Opus, tu brûles ton budget d'usage bien plus vite que nécessaire, pour un résultat identique. Ce gaspillage est invisible, et c'est exactement pour ça qu'il s'accumule.
Adaptive Mode comble cet écart. Avant l'envoi de ton premier message, il lit ton brouillon, évalue la vraie difficulté de la tâche, et suggère le modèle le moins cher de la gamme de ton provider qui sait quand même bien faire le travail. Les modèles costauds restent réservés au travail qui le mérite : architecture, audits de sécurité, grosses refactos. Tout le reste part vers un modèle qui coûte une fraction du prix.
Pourquoi calibrer le modèle sur la tâche
Arrête de surpayer les tâches faciles. Un flagship sur une correction de typo, c'est de l'argent jeté par les fenêtres. Adaptive Mode oriente le travail léger vers un modèle léger, donc chaque tâche triviale coûte une fraction de ce qu'elle coûterait sur le haut de gamme.
Garde le modèle puissant pour les problèmes durs. Calibrer ne veut pas dire toujours prendre le moins cher. Quand la tâche est une conception système ou un audit de sécurité, Adaptive Mode te dit de monter en gamme, pour que le travail qui demande de la profondeur l'obtienne vraiment.
Plus de tâches par jour sur le même forfait. Moins de budget dépensé par tâche, c'est buter sur ta limite d'usage plus tard. Sur une journée entière et une flotte d'agents en parallèle, les économies s'additionnent en débit réel supplémentaire.
Zéro friction dans le workflow. La suggestion apparaît dans une petite pastille au-dessus du composer avant l'envoi. Un clic l'applique. Pas de menu à fouiller, pas de devinette manuelle sur le bon modèle, pas de ralentissement.
L'économie : consommer moins, faire plus
Mêmes agents, même forfait. La différence, c'est combien de budget chaque tâche dévore.
Un seul modèle pour tout
- : Chaque tâche tourne sur le modèle que tu as laissé sélectionné.
- : Un flagship sur une typo ou une traduction coûte plusieurs fois trop cher.
- : Ton budget d'usage se vide vite sur du travail qui n'a jamais eu besoin de cette puissance.
- : Tu butes sur la limite d'usage plus tôt dans la journée et les agents calent.
- : Changer de modèle à la main est pénible, alors personne ne le fait.
Adaptive Mode activé
- : Chaque tâche est associée au modèle le moins cher capable de bien la faire.
- : Le travail léger part vers un modèle léger et coûte une fraction du prix.
- : Le flagship est gardé pour les refactos, les audits et l'architecture.
- : Moins de budget par tâche, donc plus de tâches avant toute limite d'usage.
- : Un clic applique le bon modèle, donc le calibrage se fait vraiment.
Le routage lui-même est quasi gratuit : un petit modèle rapide fait l'analyse pour bien moins d'un centime, puis s'efface.
Comment Adaptive Mode fonctionne, étape par étape
Il s'exécute une fois, avant ton premier message, et ne te gêne jamais.
Tu commences à taper ton prompt
Ouvre une nouvelle conversation avec n'importe quel agent et écris ce que tu veux faire. Adaptive Mode ne regarde que les conversations toutes neuves, donc il n'interrompt jamais une session déjà lancée.
Il lit la tâche et l'analyse
Quand ton brouillon est assez consistant et que tu marques une pause, Adaptive Mode envoie le début de ton brouillon à un petit modèle de routage rapide qui évalue l'exigence de la tâche.
Une suggestion de modèle apparaît
Une pastille surgit au-dessus du composer : « Passer à Haiku », « Passer à Sonnet » ou « Passer à Opus », selon le choix le plus économique. Si ton modèle actuel est déjà le meilleur, il te le dit à la place.
Tu l'appliques en un clic
Clique sur la pastille et le modèle est appliqué. Si une session tourne déjà, Adaptive Mode la bascule à chaud. Le choix est aussi enregistré sur l'agent, donc le prochain lancement démarre sur le bon modèle.
Ou recalcule, ou ignore
Reformulé ton prompt ? Appuie sur rafraîchir pour recalculer la recommandation pour le nouveau brouillon. Content de ton modèle actuel ? Ignore la pastille et envoie. Tu gardes le contrôle de chaque choix.
Ensuite, il reste discret
Adaptive Mode suggère une fois par conversation, donc il ne te harcèle jamais et ne dépense pas en douce ton quota mensuel pendant que tu continues d'éditer. Il fait son travail, puis disparaît.
Routage de modèle indépendant du provider
Adaptive Mode lit la gamme de modèles du provider que tu utilises et recommande dans ce catalogue. Il n'est lié à aucun éditeur en particulier.
Claude
Route entre Haiku, Sonnet et Opus. Haiku pour les corrections rapides, les renommages, les traductions, les petits tests et les résumés. Sonnet pour les revues de pull request, les nouveaux endpoints, le debug complexe et les refactos. Opus pour l'architecture système, les audits de sécurité, les grosses refactos legacy et le travail de performance en profondeur.
Codex
Route dans la gamme Codex, du modèle mini rapide et peu cher pour les petits bugs et les questions rapides, au modèle équilibré par défaut pour les features de bout en bout et les tests, jusqu'au modèle de raisonnement flagship pour la conception système complexe et la revue de code en profondeur.
Gemini
Route entre le modèle Gemini rapide pour les petites corrections, les traductions et les résumés, et le modèle Gemini capable pour implémenter des features, debugger et faire de l'analyse plus poussée.
Autres providers
Pour tout provider, Adaptive Mode retombe sur une règle simple : le modèle le moins cher pour le travail léger, un modèle équilibré pour le travail normal, le modèle le plus capable pour le travail difficile. Ajoute un provider et il route dans les modèles de ce provider.
FAQ
C'est quoi Adaptive Mode dans AgentsRoom ?
Adaptive Mode, c'est le routage intelligent de modèle pour tes agents de code IA. Avant l'envoi de ton premier message, il lit ton prompt et suggère le modèle le plus économique de la gamme de ton provider qui sait quand même bien faire la tâche. Une tâche légère reçoit un modèle léger et peu cher ; une tâche lourde reçoit un flagship. Le but est simple : arrêter de surpayer avec un modèle puissant un travail qui n'en a pas besoin.
Comment Adaptive Mode choisit-il un modèle ?
Il envoie le début de ton brouillon à un petit modèle de routage rapide guidé par des exemples reliant les types de tâches aux niveaux de modèle. Il renvoie ensuite le modèle le moins cher qui convient à la tâche, validé contre les modèles réellement proposés par ton provider. Si ton modèle actuel est déjà le meilleur choix, il indique que le modèle est optimal plutôt que de pousser un changement.
Concrètement, en quoi ça me fait économiser ?
Les modèles moins chers coûtent une fraction du flagship pour la même tâche simple. Si tu fais tes corrections de typo, tes renommages, tes traductions et tes petits tests sur le modèle haut de gamme, tu brûles ton budget d'usage bien plus vite que nécessaire. Adaptive Mode oriente ce travail léger vers un modèle léger, donc chaque tâche coûte moins et tu peux en faire plus avant de buter sur une limite d'usage. Sur une journée et beaucoup d'agents en parallèle, ces économies s'additionnent.
Quels modèles peut-il suggérer ?
Ceux que propose ton provider. Sur Claude, c'est Haiku, Sonnet et Opus. Sur Codex, ça couvre le modèle mini rapide, le modèle équilibré par défaut et le modèle de raisonnement flagship. Sur Gemini, ça couvre le modèle rapide et le modèle capable. Pour les autres providers, ça retombe sur le moins cher, l'équilibré et le plus capable. Adaptive Mode lit la liste de modèles en direct, donc il recommande toujours un modèle que tu peux vraiment lancer.
Est-ce qu'il change le modèle automatiquement ?
Non. Adaptive Mode se contente de suggérer. Tu appliques le changement d'un seul clic sur la pastille. Si une session tourne déjà, il bascule le modèle à chaud ; dans tous les cas, le choix est enregistré sur l'agent pour que le prochain lancement démarre sur le bon modèle. Tu peux aussi ignorer la suggestion et garder ton modèle actuel.
Quand la suggestion apparaît-elle ?
Sur une conversation toute neuve, après que tu as tapé un prompt consistant et marqué une pause. Elle tourne une fois par conversation, donc elle n'interrompt jamais une session en cours et ne dépense pas en douce ton quota mensuel pendant que tu continues d'éditer.
Puis-je recalculer la suggestion ?
Oui. Si tu réécris ton prompt, appuie sur le bouton rafraîchir de la pastille pour recalculer la recommandation pour le nouveau brouillon. Un recalcul manuel utilise une de tes suggestions mensuelles, donc il est là quand tu en as besoin sans tourner à chaque frappe.
Mon prompt est-il privé ?
Pour calculer une suggestion, seul le début de ton brouillon est envoyé aux serveurs AgentsRoom, une fois par conversation, et uniquement quand Adaptive Mode est activé. Tu peux désactiver entièrement la fonctionnalité dans les réglages si tu préfères choisir les modèles toi-même.
Adaptive Mode marche avec Codex et Gemini, pas seulement Claude ?
Oui. Adaptive Mode est indépendant du provider. Il lit le catalogue de modèles du provider que l'agent utilise et recommande dans ce catalogue, que ce soit Claude, Codex, Gemini ou un autre provider supporté. La commande de changement de modèle est construite pour le provider sur lequel tu es.
Comment activer ou désactiver Adaptive Mode ?
Il est activé par défaut, parce que calibrer le modèle fait économiser dès le départ. Tu peux le désactiver ou le réactiver quand tu veux dans les réglages d'AgentsRoom, sous Adaptive Model.
Va bien avec
Consommation de tokens Claude Code
Vois la consommation de tokens et le coût par session en temps réel. Va de pair avec Adaptive Mode : route malin, puis regarde les économies tomber.
Délégation d'agent
Un agent dev confie un test à un agent QA moins cher via MCP. Même idée qu'Adaptive Mode, appliquée à des agents entiers.
Multi-provider
Fais tourner Claude, Codex et Gemini côte à côte. Adaptive Mode route dans le provider sur lequel chaque agent se trouve.
Statistiques de projet
Temps, prompts, tokens et coût par projet et par agent. La vue tableau de bord du budget qu'Adaptive Mode t'aide à protéger.
Suivi du statut des agents
Statut en direct de chaque agent sur chaque projet, pour toujours savoir qui travaille et qui a besoin de toi.
Restaurer la session
Quitte et reviens avec chaque agent, terminal et sélection de modèle exactement là où tu les as laissés.
Arrête de payer une puissance de modèle IA dont tu n'as pas besoin
Télécharge AgentsRoom et laisse Adaptive Mode choisir le modèle le plus économique pour chaque tâche. Des modèles légers pour le travail léger, des flagships pour les problèmes durs, moins de budget brûlé par tâche, plus de tâches livrées par jour.
App companion : suivez vos agents en déplacement
Utilisez Claude, Codex, Gemini CLI ou un autre fournisseur IA.
Remontez bugs et demandes directement dans votre backlog public.
Aperçu d'AgentsRoom en action.