Strateji lobu, İcra lobu, Nöral Nöbetçi. OSP'nin üretim yapay zekâ işçilerini nasıl ortak ettiği üzerine derin teknik döküm — kanonik referans uygulama olarak SİNAN ile.
Çekirdek Tez: Bir Yapay Zekâ İşçisi Bir Mimaridir, Bir Çağrı Değil
Şu an kurumsal yapay zekâdaki en pahalı yanılgı, "yapay zekâ işçisi"nin "UI ile sarılmış LLM çağrısı" anlamına geldiği fikri. Bu çerçeveleme üretimde başarısız olan ajanları üretiyor — icradan ayrı bir strateji kavramı yok, ana akıl yürütme promptunu kirletmeyen güvenlik denetimi için yer yok, bir araç zaman aşımına uğradığında zarif bir bozulma yok. Beyin Mimarisi farklı bir ilk prensipten başlıyor. Bir yapay zekâ işçisi üç uzmanlaşmış döngünün bileşimi; her biri kendi context disipliniyle, küçük yapılandırılmış bir sözleşme üzerinden birbirleriyle konuşuyor. Mimari ürünün ta kendisi. Model sadece bir bileşeni; sistemi etrafında yeniden tasarlamak zorunda kalmadan talep üzerine değiştirilebilir.
Strateji Lobu, Detayda
Strateji lobu üç sorumluluğu üstleniyor. Rejim algılama — sistemin ne tür bir durumda olduğunu anlamak. Kullanıcı hızlı bir olgusal soru mu soruyor, çok adımlı bir araştırma görevi mi, bir eylem isteği mi, açıklama gerektiren belirsiz bir mesaj mı? Farklı rejimler farklı aşağı akış davranışlarına yönlendiriyor. Planlama döngüsü — bir rejim verildiğinde görevi araç çağrıları ve ara akıl yürütme adımlarından oluşan bir diziye ayırmak; muhtemel başarısızlık modları için açık yedeklerle. Yedek tasarımı — katalog API'si zaman aşımına uğradığında, RAG ilgili hiçbir şey döndürmediğinde, kullanıcı konuşmanın ortasında fikir değiştirdiğinde ne oluyor. Yedek planın bir parçası, sonradan eklenmiş bir şey değil. Uygulama açısından strateji lobu genellikle düşük sıcaklıkta daha güçlü bir akıl yürütme modelinde çalışır, yapılandırılmış JSON planlar üretir ve planlar somut eserler olduğu için bağımsız değerlendirilmesi en kolay lobtur.
İcra Lobu, Detayda
İcra lobu dünyaya dokunan kısım. Üç alt sistem. Araç kayıt defteri — sistemin gerçekleştirebileceği her dış eylemin tipli kataloğu: API çağrıları, veritabanı sorguları, dosya operasyonları, model içi alt çağrılar. Her araç bir sözleşmeyle geliyor: girdi şeması, çıktı şeması, beklenen latency, başarısızlık modları. İcra lobu kayıt defteri dışında hiçbir şeyi çağırmıyor; kayıt defterini tek denetim noktası yapan da bu. RAG stratejisi — retrieval kendisi bir araç, ama özel bir tane. İki aşamalı retrieval varsayılan — geri çağırma için semantik arama, hassasiyet için yeniden sıralayıcı. Vektör aramanın yanına anahtar kelime aramayı koyan hibrit retrieval, adlandırılmış varlıkları saf vektörden daha iyi idare ediyor. Eylem grameri — çok araçlı dizilerin nasıl bileştiği kuralları. Mümkün olan yerde idempotency, mümkün değilse rollback, bir adım başarısız olduğunda strateji lobuna geri yapılandırılmış hata yayılımı.
Nöral Nöbetçi, Detayda
Nöral nöbetçi çoğu ekibin atladığı ve atlamış olmaktan en çok pişman olduğu lob. Üç kategori uyanıklık. Anomali sınıfları — beklenen dağılımların dışına düşen çıktılar, token bütçesini 5x aşan konuşmalar, döngüye giren araç dizileri, alınan dokümanlarda gizlenmiş prompt injection denemeleri. Nöbetçi hepsini izliyor; genellikle üretim yerine sınıflandırma için uzmanlaşmış daha ucuz modeller kullanarak. Kill switch'ler — ajanı durduran ve konuşmayı bir insana yönlendiren açık tetikler. Düzenleyicilerin görmek istediği şey kill switch dokümantasyonu; denetçilerin okumak istediği şey kill switch logları. Eskalasyon yolları — her anomali ölümcül değil. Bazıları yavaşlamayı, bazıları kullanıcıya açıklama isteğini, bazıları anında insan teslimini hak ediyor. Eskalasyon matrisi sistem promptunun yanında yaşayan ve aylık incelenen küçük bir tablo.
Üç Lob Nasıl Bileşiyor
Bileşim sözleşmesi bilerek küçük. Strateji yapılandırılmış JSON olarak plan yayınlıyor. İcra planı tüketiyor ve (araç, girdi, çıktı, durum) demetlerinden oluşan bir dizi yayınlıyor. Nöbetçi demetler akışını ve kullanıcıya yönelik çıktıları gözlemliyor; {pass, slow, escalate, kill} hükümlerini yayınlıyor. Durum, boyutu sınırlı paylaşılan bir scratchpad üzerinden akıyor — tipik olarak 8K token, taştığında agresifçe özetlenmiş. Akış asenkron; strateji icra hâlâ koşarken yeniden planlayabilir, nöbetçi kontrol noktalarında değil sürekli koşar. Orkestrasyon kodu küçük — genellikle 500 satırın altında — ama loblar arasındaki sözleşmeler güvenilirliğin geldiği yer. Daha büyük orkestrasyon kodu, loblardan birinin yanlış işi yaptığının kokusudur.
Loblar Arası Eval Stratejisi
Uçtan uca eval'ler gerekli ama yetersiz. Sistemin iyi olup olmadığını söylüyorlar; kötüleştiğinde nedenini söylemiyorlar. Lob başına eval'ler boşluğu dolduruyor. Strateji lobu — (istek, beklenen plan) altın senaryoları, icra sonucundan bağımsız plan kalitesinde puanlanmış. İcra lobu — (plan, beklenen araç dizisi) altın senaryoları, planın doğru olduğu varsayımıyla araç kullanım doğruluğunda puanlanmış. Nöbetçi — sırasıyla {slow, escalate, kill} tetiklemesi gereken adversarial girdiler test seti, sınıflandırma doğruluğunda puanlanmış. Tam eval suite haftalık koşuyor. Uçtan uca eval'ler daha küçük bir senaryo seti üzerinde gece koşuyor. Lob başına eval'ler o lobun promptu veya modeli üzerinde her anlamlı değişiklikte koşuyor. Disiplin gösterişli değil; sessizce kayan bir sistemi kalibre kalan bir sistemden ayıran şey o.
Kanonik Örnek Olarak SİNAN
SİNAN — Archidecors müşteri yüzüne dönük yapay zekâ işçisi — yukarıda anlatıldığı gibi Beyin Mimarisini çalıştırıyor. Strateji lobu dört rejim arasında yönlendiriyor: hızlı soru, tasarım talebi, teklif talebi, eskalasyon. İcra lobu bir ürün kataloğu RAG'ını, bir görüntü üretim aracını, bir sipariş taslak aracını ve bir CRM entegrasyonunu sarıyor. Nöral nöbetçi fiyat-tabanı korkuluklarını uyguluyor, şüpheli sahtekarlığı işaretliyor, kontrolden çıkmış-döngü konuşmalarını izliyor ve insan satıcıya kill-switch teslimini sahipleniyor. On sekiz aydır üretimde. Günde yüzlerce konuşma. Sıfır yönetişim olayı. Eval geçme oranı haftalık ölçülüyor; %94 civarında dolaşıyor, model-sürümüne özgü düşüşler her zaman bir haftalık ayar geçişinden sonra toparlanıyor. Mimari tekrarlanabilir; üretim seviyesinde olmasını sağlayan işletim disiplini. Disiplinsiz Beyin Mimarisi yalnızca daha güzel bir diyagram. Disiplinle birlikte sevk edilen bir ajanla operasyonda çalışan bir ajan arasındaki fark.