Tek bir LLM çağrısı bir mimari değildir. Beyin Mimarisi sorunu üç loba ayırır — strateji, icra, nöral nöbetçi — ve mühendisliğin yaşadığı yer orkestrasyondur.
Tek Ajan Neden Ölçeklenmiyor
LLM destekli bir ürün inşa ederken refleks, tek bir model çağrısını sistem promptu ile sarmak, biraz araç eklemek ve sevk etmek. Dar bir chatbot ya da tek görevli otomasyon için bu desen iyi. Ajan çelişen hedefleri — doğruluğa karşı gecikmeyi, akıl yürütme derinliğine karşı maliyeti, keşfe karşı güvenliği — dengelemek zorunda kaldığında çatlaklar görünüyor. Tek bir prompt altındaki tek ajan bu ödünleşimleri temiz tutamıyor; prompt ya kendisiyle çelişen 4K'lık monolitlere büyüyor ya da ajan sessizce bir hedefi seçip diğerlerini görmezden geliyor. Çoklu ajan mimarileri her endişeye kendi döngüsünü, kendi context penceresini ve kendi başarısızlık modunu vererek bunu çözüyor. Beyin Mimarisi bu desenin üretimde işe yarayan bir ifadesi.
Üç Lob — Strateji Lobu, İcra Lobu, Nöral Nöbetçi
Strateji lobu rejim algılama, planlama ve hedef ayrıştırmayı üstleniyor. Bir kullanıcı isteği ve mevcut durum verildiğinde plan üretir: hangi araçlar, hangi sırayla, hangi yedek planlar. İcra etmiyor; karar veriyor. İcra lobu planı alıyor ve çalıştırıyor. Araç çağrıları, RAG sorguları, dosya operasyonları, yapılandırılmış çıktı üretimi. Dünyaya dokunan kısım. Nöral Nöbetçi her iki lobu anomaliler, politika ihlalleri ve kontrolden çıkmış davranış için izliyor. Kill switch onun. Üç lob durumlarını yapılandırılmış bir mesaj veriyolu üzerinden paylaşıyor — tipik olarak küçük bir JSON sözleşmesi — ve her biri kendi modeli, kendi sıcaklığı, kendi context disipliniyle çalışıyor.
Çoklu Ajanı Tek Ajana Ne Zaman Tercih Etmeli
Üç tetik. Görev domain'leri aşıyor — stratejik akıl yürütme artı taktik icra artı güvenlik denetimi gerçekten üç iş; tek bir prompt sızıntısız tutamıyor. Latency bütçesi paralelliğe izin veriyor — paralel çalışan iki lob, seri çalışan tek bir 8K-token promptu yenebiliyor. Başarısızlık modlarının ayrılması gerekiyor — strateji yanlışsa, icra gürültüsü olmadan debug etmek istiyorsun; icra başarısızsa, plan mı kötüydü yoksa araç mı bilmek istiyorsun. Bu üç tetik geçerli değilse tek ajan doğru cevap. Çoklu ajan kendi başına sevimli değil; ek orkestrasyon maliyeti gerçek.
Yük Altında Ayakta Kalan Orkestrasyon Desenleri
Üç desen baskın. Plan ve icra et — strateji lobu tam plan üretiyor, icra lobu sona kadar koşturuyor, nöbetçi süreç boyunca izliyor. Tahmin edilebilir yapılı görevlerde en iyisi. Refleksif döngü — icra lobu bir adım koşturuyor, yeniden planlama için strateji lobuna dönüyor, tekrarlıyor. İcranın ortasında ortamın değiştiği görevler için en iyisi. Hiyerarşik yetkilendirme — strateji lobu paralel alt-görevler için alt-ajanlar üretiyor, sonuçları topluyor, kullanıcıya dönüyor. Retrieval ağırlıklı veya araştırma tarzı görevler için en iyisi. Yanlış deseni seçmek çoklu ajan sistemlerinin en yaygın hatası — tahmin edilebilir bir görevde refleksif döngü token yakar; değişken bir görevde plan-ve-icra et yanlış cevapları kendinden emin sevk eder.
Referans Uygulamalar Olarak SİNAN ve BÖRÜ Pack
SİNAN — Archidecors yapay zekâ işçisi — üç loblu deseni plan-ve-icra et orkestrasyonuyla çalıştırıyor. Strateji lobu müşteri niyet sınıflandırmasını ve teklif-mi-tasarım-mı kararını idare ediyor. İcra lobu ürün kataloğu üzerinden RAG, görüntü üretim çağrıları ve sipariş taslağını idare ediyor. Nöral nöbetçi fiyatlandırma korkuluklarını uyguluyor ve politika dışı talepleri insan incelemesi için işaretliyor. On sekiz aydır üretimde, sıfır yönetişim olayı, eval skoru haftalık ölçülüyor. BÖRÜ Pack aynı üç loblu soyutlamayı sürü ölçeğinde çalıştırıyor — strateji sürü düzeyinde, icra bireysel platform düzeyinde, nöbetçi her iki düzeyde, kill-switch kararlarında platformlar arası konsensüs ile. Farklı domain, aynı mimari, aynı işletim disiplini.
Loblar Arası Eval Stratejisi
Çoklu ajan sistemlerini değerlendirmek tek ajanı değerlendirmekle aynı şey değil; aynıymış gibi davranmak iyi görünen ama kötü ajanlar sevk eden eval skorları üretiyor. Her lob kendi eval suite'ini alıyor. Strateji plan kalitesi üzerinde değerlendiriliyor — bir istek verildiğinde, plan doğru araçları doğru sırada makul yedeklerle kapsıyor mu. İcra araç kullanım doğruluğu ve çıktı yapısı üzerinde değerlendiriliyor. Nöbetçi red-team senaryoları üzerinde — adversarial girdiler, prompt injection, politika ihlalleri, kontrolden çıkmış döngüler. Uçtan uca eval'ler görev başarı oranını ve maliyeti ölçüyor ama bir regresyonun nereden geldiğini tanılayamıyor. Lob başına eval'ler bu tanı işini yapıyor; var oluş sebepleri bu. Çoklu ajan dünyasında üretim disiplini bu kombinasyona benziyor.