AgentsRoom теперь поддерживает Ollama: запускайте локальные модели рядом с облаком

Ollama теперь провайдер в AgentsRoom. Запускайте локальные open-source модели вроде Llama, Qwen, Gemma и DeepSeek рядом с облачными агентами и задавайте каждому агенту регулятор локально-или-облако, переключаемый прямо посреди диалога.

3 июля 2026 г.

Ollama теперь поддерживаемый провайдер в AgentsRoom. Вы можете назначить локальную open-source модель любому агенту, запустить её на той же доске, что и Claude, Codex, Grok Build и Mistral Vibe, и переключаться посреди диалога, не теряя контекст. Модели с открытыми весами, которые вы уже знаете, Llama, Qwen, Gemma, DeepSeek и остальные, теперь заступают на службу в вашей комнате.

Ollama не совсем такой, как другие провайдеры, которых мы добавляли. Это не просто ещё один агент, на которого можно сделать ставку. Это дверь в весь каталог open-source моделей, работающий на вашем собственном железе, с нулевой стоимостью за токен и приватный по умолчанию.

Что такое Ollama

Ollama, это свободная среда выполнения с открытым кодом, которая скачивает и запускает большие языковые модели прямо на вашей машине. Одна команда, ollama pull qwen3-coder, забирает модель. ollama run поднимает её на локальной конечной точке по адресу http://localhost:11434. Она предоставляет API, совместимый с OpenAI, и именно поэтому агенты для кода могут общаться с ней без всякой самописной обвязки, а работает всё это на macOS, Windows и Linux.

Она также поддерживает вызов инструментов, то самое, что нужно агенту для кода, чтобы редактировать файлы и выполнять команды, а не просто вести беседу. Библиотека моделей читается как список лучших из открытых весов: Llama, Qwen, Gemma, DeepSeek, Mistral, Phi и другие, в размерах под что угодно, от ноутбука до GPU рабочей станции.

Два факта держат на себе всю остальную часть этой статьи. Модели работают на вашей машине, поэтому ничто из напечатанного вами не уходит в сеть. А у локального вывода нет счёта за каждый токен. Всё, что ниже, вытекает из этих двух фактов.

Выбор между локальным и облаком, с которым все смирились

До сих пор решение было бинарным. Ставите всё на облако, получаете передовые рассуждения, но каждый запрос и каждый файл, к которому вы прикасаетесь, отправляется в сторонний API и тарифицируется по токенам. Ставите всё на локальное, получаете приватность и нулевую стоимость, но отказываетесь от самых сильных моделей на тех задачах, которым они действительно нужны. Большинство команд выбирают одну полосу и держатся её.

Эта бинарность, ложный выбор, потому что кодовая база, это не один вид работы. Переименовать символ в сорока файлах, написать шаблонные тесты, обобщить diff, набросать сообщение коммита: ничему из этого не нужна передовая модель, и многое из этого затрагивает код, который вы предпочли бы никуда не отправлять. А вот один заковыристый архитектурный рефакторинг, возможно, потребует большого движка. Платить передовые облачные цены за рутину или связывать сложную задачу слишком маленькой моделью, это налог, который вы платите за то, что относитесь к выбору по принципу всё или ничего.

В AgentsRoom локальное или облако, это регулятор, а не переключатель

AgentsRoom уже даёт каждому агенту собственного провайдера и собственную модель. Добавление Ollama означает, что теперь каждый агент может стоять где угодно на шкале от локального к облаку, и вы задаёте это для каждого агента, под каждую задачу.

Регулятор, это буквально идентификатор модели. Наберите qwen3-coder:30b, и агент запустит Qwen локально через Ollama, на вашем железе, бесплатно. Добавьте суффикс :cloud, то есть glm-4.6:cloud, и тот же агент запустит эту модель уже через вашу подписку Ollama Cloud. Один суффикс перемещает агента с вашего GPU на размещённый на хостинге, не трогая ничего другого в настройке.

Поскольку AgentsRoom сохраняет ваш контекст при смене провайдера, регулятор двигается и посреди диалога. Запустите агента на локальной модели, дайте ему перемолоть механическую часть задачи, затем переключите его на облачную модель ради того единственного шага, которому нужны более глубокие рассуждения. AgentsRoom составляет сводку передачи: затронутые файлы, прогресс и активность сессии, чтобы облачная модель подхватила ровно там, где остановилась локальная. Верните всё обратно, когда сложная часть будет позади.

Как этим пользоваться

Если вы уже работаете в AgentsRoom, учить почти нечего:

Установите Ollama с ollama.com и загрузите модель: ollama pull qwen3-coder:30b. Модель Qwen Coder, сильный вариант по умолчанию для кода. Машины поскромнее спокойно тянут 7B, а GPU на 24GB справляется с 30B при большом окне контекста.
В настройках AgentsRoom выберите Ollama как провайдера, либо по умолчанию, либо для отдельного агента.
Создайте агента, задайте ему роль и в поле модели наберите идентификатор модели Ollama. Используйте qwen3-coder:30b, чтобы запустить её локально, или добавьте :cloud, чтобы запустить через Ollama Cloud.
Отправьте запрос. AgentsRoom запускает реальный процесс ollama run в папке вашего проекта и передаёт вывод в реальном времени, ровно так же, как ведёт всех остальных провайдеров.

Совет с полей: Ollama по умолчанию задаёт новым моделям небольшое окно контекста. Для агентской работы увеличьте его, чтобы агент мог держать в поле зрения реальный кусок вашего репозитория, а не только последние несколько сообщений.

Экономика бесплатного и приватного роя

AgentsRoom создан для параллельного запуска агентов: целая доска из них, каждый на своей задаче, каждый со своей точкой статуса. У облачных провайдеров этот параллелизм идёт со счётчиком, который крутится, ведь шесть агентов, работающих разом, это шесть токеновых счетов, растущих вместе. У локальных моделей Ollama предельная стоимость токена равна нулю. Поднимите рой, дайте ему работать весь вечер, и единственный счёт, это электричество.

Столбчатая диаграмма, сравнивающая текущую стоимость шести агентов для кода, работающих параллельно. Облачный флот, это высокий столбец, потому что каждый из шести агентов тарифицируется по токенам. Локальный флот на моделях Ollama, это крошечный столбец у базовой линии, потому что у локального вывода нет счёта за каждый токен, так что единственная стоимость, это электричество.

Это меняет само назначение параллелизма. Когда каждый агент тарифицируется, вы их нормируете. Когда они бесплатны, вы можете позволить себе щедрость с пользой: локальный агент, следящий за расхождениями линтера, ещё один, поддерживающий актуальность changelog, ещё один, набрасывающий тесты для каждой новой функции, и все они работают в фоне с нулевой предельной стоимостью, пока ваш тарифицируемый облачный агент остаётся зарезервированным под работу, которой он действительно нужен. Если запуск множества агентов сразу для вас в новинку, мы описали этот приём в статье запуск агентов для кода параллельно.

Приватность, за которую не нужно оправдываться

Для многих команд решающий фактор, это не стоимость, а то, куда уходит код. Регулируемые отрасли, работа для клиентов под NDA, внутренняя кодовая база, которую юристы не подпустят к стороннему API: локальный вывод отвечает на вопрос ещё до того, как его зададут, ведь модель работает на машине, и запрос никогда не уходит в сеть. Ничего не нужно согласовывать, ни соглашения об обработке данных, ни пункта о резидентности данных.

AgentsRoom выдерживает эту позицию из конца в конец. Локальные модели держат ваш код на машине, а собственная синхронизация AgentsRoom между вашим десктопом и телефоном зашифрована сквозным образом, так что надзор за флотом с другого конца комнаты никогда не перечёркивает приватность, которую вам только что обеспечила локальная модель. Если вы читаете это ради соответствия требованиям, именно в этом сочетании и заключается суть, и оно хорошо сочетается с практиками из нашей заметки о vibe coding и соответствии GDPR.

Дальше гибридный подход складывается сам собой: направляйте приватное и массовое к локальной модели, эскалируйте в облако только сложные, нечувствительные рассуждения и позвольте регулятору взять на себя передачу. Вы получаете передовую мощность там, где она себя окупает, и локальную приватность везде в остальном.

Почему это важно

AgentsRoom никогда не был клиентом для одной модели или одного вендора. Это кабина управления для запуска нужного агента под каждую задачу, бок о бок, под одной парой глаз. Ollama расширяет это обещание вполне конкретным образом: это не ещё один облачный агент, которого надо подключить, это вся экосистема открытых весов, на ваших условиях, с нулевой ценой и приватная по умолчанию.

Локальное для многих, облако для немногих, и регулятор, чтобы перемещать любого агента между ними. Скачайте AgentsRoom, подключите Ollama и отправьте в работу целую комнату open-source моделей. Посмотрите полную матрицу совместимости провайдеров или узнайте больше о поддержке нескольких провайдеров и о том, как переключение посреди диалога сохраняет ваш контекст нетронутым.