AgentsRoom artık Ollama'yı destekliyor: yerel modelleri bulutun yanında çalıştırın

Ollama artık AgentsRoom'da bir sağlayıcı. Llama, Qwen, Gemma ve DeepSeek gibi yerel açık kaynak modelleri bulut ajanlarının yanında çalıştırın ve her ajana, konuşmanın ortasında değiştirilebilen bir yerel-veya-bulut kadranı ayarlayın.

Ollama artık AgentsRoom'da desteklenen bir sağlayıcı. Herhangi bir ajana yerel bir açık kaynak model atayabilir, onu Claude, Codex, Grok Build ve Mistral Vibe ile aynı panoda çalıştırabilir ve bağlamınızı kaybetmeden konuşmanın ortasında geçiş yapabilirsiniz. Zaten tanıdığınız açık ağırlıklar, Llama, Qwen, Gemma, DeepSeek ve gerisi, artık odanızda göreve hazır.

Ollama, eklediğimiz diğer sağlayıcılara pek benzemiyor. Üzerine bahis oynanacak bir ajan daha değil. Kendi donanımınızda çalışan, token başına sıfır maliyetli ve varsayılan olarak gizli olan bütün açık kaynak model kataloğuna açılan bir kapı.

Ollama nedir

Ollama, büyük dil modellerini kendi makinenize indiren ve orada çalıştıran ücretsiz, açık kaynaklı bir çalışma zamanıdır. Tek bir komut, ollama pull qwen3-coder, modeli getirir. ollama run onu http://localhost:11434 adresindeki yerel bir uç noktada sunar. OpenAI uyumlu bir API sunar ve kodlama ajanlarının onunla hiçbir el yapımı yapıştırıcı olmadan konuşabilmesinin nedeni tam olarak budur. macOS, Windows ve Linux üzerinde çalışır.

Ayrıca tool calling'i de destekler, yani bir kodlama ajanının yalnızca sohbet etmek yerine dosyaları düzenlemesi ve komutlar çalıştırması için ihtiyaç duyduğu şeyi. Model kütüphanesi, açık ağırlıkların bir seçkinler listesi gibi okunur: Llama, Qwen, Gemma, DeepSeek, Mistral, Phi ve daha fazlası, dizüstü bilgisayardan iş istasyonu GPU'suna kadar her şeye uyacak boyutlarda.

İki gerçek, bu yazının geri kalanının tamamını taşıyor. Modeller sizin makinenizde çalışır, dolayısıyla yazdığınız hiçbir şey ağı geçmez. Ve yerel çıkarımın token başına faturası yoktur. Aşağıdaki her şey bu iki noktanın sonucudur.

Herkesin kabullendiği yerel-bulut seçimi

Şimdiye kadar karar ikiliydi. Her şeyinizi buluta yatırırsınız: en üst düzey akıl yürütme, ama dokunduğunuz her istem ve her dosya üçüncü taraf bir API'ye gönderilir ve token başına sayaca vurulur. Ya da her şeyinizi yerele yatırırsınız: gizlilik ve sıfır maliyet, ama gerçekten ihtiyaç duyan problemlerde en güçlü modellerden vazgeçersiniz. Çoğu ekip bir şerit seçer ve orada kalır.

Bu ikilik sahte bir seçim, çünkü bir kod tabanı tek bir iş türü değildir. Bir sembolü kırk dosyada yeniden adlandırmak, kalıp testler yazmak, bir diff'i özetlemek, bir commit mesajı hazırlamak: bunların hiçbiri en üst düzey bir model gerektirmez ve çoğu, hiçbir yere göndermek istemeyeceğiniz koda dokunur. Çetrefilli bir mimari yeniden düzenleme ise belki büyük motora ihtiyaç duyar. Sıradan işler için en üst düzey bulut fiyatları ödemek ya da zor görevi fazla küçük bir modelle sekteye uğratmak, bu seçimi ya hep ya hiç olarak ele almanın size ödettiği vergidir.

AgentsRoom'da yerel ya da bulut bir kadrandır, bir anahtar değil

AgentsRoom zaten her ajana kendi sağlayıcısını ve kendi modelini verir. Ollama'yı eklemek, her ajanın artık yerelden buluta uzanan kadranın herhangi bir yerine oturabilmesi demektir ve bunu ajan başına, görev başına siz ayarlarsınız.

Ajan başına yerelden buluta bir kadran başlıklı diyagram. Üç ajanın her biri kendi yatay şeridinde oturuyor; bu şerit soldaki, gizli, ücretsiz ve makinenizde olarak işaretlenmiş yerel uçtan, sağdaki, en üst düzey, ücretli ve barındırılan olarak işaretlenmiş bulut ucuna uzanıyor. Toplu yeniden düzenleme ajanının düğmesi yerel uca yakın ve qwen3-coder:30b çalıştırıyor, bir test yazarı gemma3:12b ile yerel uca yakın oturuyor ve bir mimarın düğmesi glm-4.6:cloud ile bulut ucuna yakın.

Kadran, tam anlamıyla modelin kimliğidir. qwen3-coder:30b yazın, ajan Qwen'i Ollama üzerinden yerel olarak, kendi donanımınızda, ücretsiz çalıştırsın. Bir :cloud soneki ekleyin, glm-4.6:cloud, aynı ajan bunun yerine o modeli Ollama Cloud aboneliğiniz üzerinden çalıştırsın. Tek bir sonek, kurulumdaki başka hiçbir şeye dokunmadan bir ajanı sizin GPU'nuzdan barındırılan bir GPU'ya taşır.

AgentsRoom, bir sağlayıcı değişikliği boyunca bağlamınızı koruduğu için kadran konuşmanın ortasında da hareket eder. Bir ajanı yerel bir modelde başlatın, bir görevin mekanik kısmını öğütmesine izin verin, sonra daha derin akıl yürütme gerektiren o tek adım için onu bir bulut modeline geçirin. AgentsRoom bir devir teslim özeti oluşturur, dokunulan dosyalar, ilerleme ve oturum etkinliği, böylece bulut modeli tam olarak yerel modelin bıraktığı yerden devam eder. Zor kısım bitince geri çevirin.

Nasıl kullanılır

AgentsRoom'u zaten kullanıyorsanız, öğrenilecek neredeyse hiçbir yeni şey yok:

  1. Ollama'yı ollama.com adresinden kurun ve bir model çekin: ollama pull qwen3-coder:30b. Bir Qwen Coder modeli, kod için güçlü bir varsayılan seçimdir. Daha mütevazı makineler 7B'yi rahatça çalıştırır ve 24GB'lik bir GPU, geniş bir bağlam penceresiyle 30B'yi kaldırır.
  2. AgentsRoom ayarlarında Ollama'yı sağlayıcı olarak seçin, ister varsayılan olarak ister tek bir ajanda.
  3. Bir ajan oluşturun, ona bir rol verin ve model alanına Ollama model kimliğini yazın. Yerel olarak çalıştırmak için qwen3-coder:30b kullanın ya da Ollama Cloud üzerinden çalıştırmak için :cloud ekleyin.
  4. Bir istem gönderin. AgentsRoom, proje klasörünüzde gerçek ollama run sürecini başlatır ve çıktıyı canlı olarak akıtır, tıpkı diğer her sağlayıcıyı sürdüğü gibi.

Sahadan bir ipucu: Ollama, yeni modellere varsayılan olarak küçük bir bağlam penceresi atar. Ajansal iş için onu büyütün ki ajan, yalnızca son birkaç mesajı değil, deponuzun gerçek bir dilimini görüş alanında tutabilsin.

Ücretsiz, gizli bir sürünün ekonomisi

AgentsRoom, ajanları paralel çalıştırmak için kurulmuştur: bir pano dolusu, her biri kendi görevinde, her biri kendi durum noktasıyla. Bulut sağlayıcılarında bu paralellik çalışan bir sayaçla gelir, çünkü aynı anda çalışan altı ajan, birlikte tırmanan altı token faturasıdır. Yerel Ollama modellerinde bir token'ın marjinal maliyeti sıfırdır. Bir sürü başlatın, bütün öğleden sonra çalışmasına izin verin, tek fatura elektrik faturasıdır.

Paralel çalışan altı kodlama ajanının çalışma maliyetini karşılaştıran çubuk grafik. Bulut filosu yüksek bir çubuk, çünkü altı ajanın her biri token başına sayaca vuruluyor. Ollama modellerindeki yerel filo, taban çizgisine yakın minik bir çubuk, çünkü yerel çıkarımın token başına faturası yok, dolayısıyla tek maliyet elektrik.

Bu, paralelliğin ne işe yaradığını değiştirir. Her ajan sayaca vurulduğunda onları kısıtlarsınız. Ücretsiz olduklarında ise faydalı bir biçimde cömert olmayı göze alabilirsiniz: lint sapmalarını gözeten bir yerel ajan, changelog'u güncel tutan bir başkası, her yeni fonksiyon için test taslağı hazırlayan bir diğeri, hepsi arka planda sıfır marjinal maliyetle çalışırken, faturalı bulut ajanınız gerçekten ihtiyaç duyan iş için ayrılmış kalır. Aynı anda birçok ajan çalıştırmak sizin için yeniyse, bu ilkeyi kodlama ajanlarını paralel çalıştırma yazımızda anlattık.

Savunmasına gerek olmayan bir gizlilik

Pek çok ekip için belirleyici etken maliyet değil, kodun nereye gittiğidir. Düzenlemeye tabi sektörler, NDA altındaki müşteri işleri, hukuk departmanının üçüncü taraf bir API'nin yanına yaklaştırmayacağı dahili bir kod tabanı: yerel çıkarım, soru daha sorulmadan yanıtlar onu, çünkü model makinede çalışır ve istem ağı asla geçmez. İncelenecek bir şey yok, veri işleme sözleşmesi yok, veri ikametgahı maddesi yok.

Hibrit desenin akış diyagramı, varsayılan yerel ve talep üzerine bulut. Gelen kodlama işi, görevine göre yönlendiren bir triyaj adımına ulaşır. Toplu, gizli ve rutin işler, gizli, ücretsiz ve makineyi asla terk etmeyen kodla birçok ajanı paralel çalıştıran Ollama üzerindeki yerel bir modele gider. Zor, hassas olmayan akıl yürütme, ihtiyaç duyulan o tek adımda en üst düzey güç için bir bulut modeline gider. Kesik çizgili bir ok, aynı ajanın görevin ortasında yerelden buluta yükseldiğini gösterir; AgentsRoom bağlamı bu geçiş boyunca taşır.

AgentsRoom bu duruşa baştan sona uyar. Yerel modeller kodunuzu makinede tutar ve AgentsRoom'un masaüstünüzle telefonunuz arasındaki kendi senkronizasyonu uçtan uca şifrelidir, dolayısıyla filoyu odanın öbür ucundan denetlemek, yerel modelin size az önce sağladığı gizliliği asla bozmaz. Buraya sizi getiren neden uyumluluksa, mesele tam da bu birleşimdir ve bu, vibe coding ve GDPR uyumu üzerine notumuzdaki uygulamalarla iyi örtüşür.

Hibrit desen sonra kendiliğinden ortaya çıkar: gizli olanı ve toplu olanı bir yerel modele yönlendirin, buluta yalnızca zor, hassas olmayan akıl yürütmeyi yükseltin ve devir teslimi kadrana bırakın. Hak ettiği yerde en üst düzey gücü, başka her yerde yerel gizliliği elde edersiniz.

Neden önemli

AgentsRoom hiçbir zaman tek bir modelin ya da tek bir satıcının istemcisi olmadı. Her göreve doğru ajanı, yan yana, tek bir çift gözün altında çalıştırmak için bir kokpittir. Ollama bu vaadi belirli bir şekilde genişletir: bağlanacak bir bulut ajanı daha değil, kendi koşullarınızda, sıfır fiyatına ve varsayılan olarak gizli, açık ağırlıklar ekosisteminin tamamıdır.

Çoğunluk için yerel, azınlık için bulut ve herhangi bir ajanı ikisi arasında taşımak için bir kadran. AgentsRoom'u indirin, Ollama'yı bağlayın ve açık kaynak modellerle dolu bir odayı işe koşun. Tam sağlayıcı uyumluluk matrisini inceleyin ya da çoklu sağlayıcı desteği ve konuşmanın ortasında geçişin bağlamınızı nasıl bozulmadan koruduğu hakkında daha fazlasını okuyun.

AgentsRoom'u Indirin

Yapay zeka ajanlarınızı (Claude, Codex, Antigravity CLI, OpenCode, Aider) tüm projelerinizde tek bir pencereden çalıştırın.

ÜcretsizAgentsRoom'u Indir

Yardımcı uygulama: hareket halindeyken ajanlarinizi izleyin

Claude, Codex, Antigravity CLI veya başka bir AI sağlayıcı kullan.

Uzantıyı yükleyin
Chrome Web Store

Hataları ve istekleri doğrudan genel backlogunuza gönderin.

AgentsRoom'a kısa bir bakış.

Çoklu proje
Çoklu sağlayıcı
Çoklu ajan
Canlı durum
Diff ve commit
Mobil uygulama
Canlı önizleme
Ajan ekipleri
Tarayıcı otomasyonu
Backlog odaklı dev
Prompt kütüphanesi
Beceri kütüphanesi
Tüm özellikleri gör