استغرق DevOps عشر سنوات ليُنضج. AgentOps لديه ثمانية عشر شهراً. الأعمدة الخمسة، الدور الذي لم يوظّفه أحد بعد، وكيف تُسلّم OSP فريق التشغيل الذي لن تضطر لبنائه.
من DevOps إلى AgentOps في ثمانية عشر شهراً
استغرق DevOps قرابة عقد ليتبلور كانضباط معترف به بأدوات مشتركة ومفردات مشتركة وفهم مشترك لما تعنيه عبارة "جاهز للإنتاج". AgentOps لا يملك هذا المدى. أُطلقت أول وكلاء LLM إنتاجية في أواخر 2023. وبحلول الربع الثاني من 2026، اكتشفت المؤسسات التي تشغّلهم على نطاق واسع أن المتطلبات التشغيلية لا تشبه البرمجيات الكلاسيكية، ولا تشبه ML الكلاسيكي. الانجراف أسرع، سطح التكلفة غير مألوف، وأنماط الفشل لغوية لا بنيوية. الدور يتشكّل في الزمن الحقيقي، والفرق التي تدرك ذلك مبكراً تشتري لنفسها اثني عشر شهراً من الأفضلية المتراكمة.
الأعمدة الخمسة التي تحدد الانضباط
العمود الأول المراقبة — لا لوحات بنية تحتية، بل قياس على مستوى المحادثة. ماذا قال الوكيل، لمن، ضمن أي سياق، بأي تكلفة. العمود الثاني التقييم — مجموعة من الحالات الذهبية والاختبارات العدائية واختبارات الانحدار، تعمل بشكل مستمر، أسبوعياً في الحالة المثالية. العمود الثالث التكلفة — إنفاق التوكنات لكل محادثة ولكل شريحة مستخدمين ولكل ميزة، مع تنبيهات شذوذ حين يقفز إنفاق مستخدم واحد عشرة أضعاف. العمود الرابع الحوكمة — مسار التدقيق، سجل السياسات، توثيق مفتاح الإيقاف الذي سيطلبه المدققون والمنظمون. العمود الخامس الترحيل — دليل تبديل النموذج الأساسي حين يصدر إصدار Claude أو GPT الجديد، لأنه سيصدر، ولأن الانتظار ثمانية أسابيع للترقية هو خسارة تنافسية.
متخصص AgentOps: دور لم يوظّفه أحد بعد
كشف تقرير BlueMark Academy للذكاء الاصطناعي المؤسسي 2026 عن الحقيقة بصراحة — 6٪ فقط من المنظمات التي تشغّل وكلاء في الإنتاج لديها مالك مخصص لـ AgentOps. الـ 94٪ المتبقية وزّعت العمل بين علوم البيانات وهندسة المنصات والمنتج، ولا أحد منهم يعتبره مسؤوليته الأساسية. هذه الفجوة ليست نظرية. تظهر للسطح لحظة ينكسر شيء في الثانية صباحاً وتشير ثلاث فرق بأصابعها إلى بعضها. التوصيف الوظيفي يكتب نفسه: امتلك خط أنابيب التقييم، امتلك قياس التكلفة، امتلك توثيق الحوكمة، امتلك دليل ترحيل النماذج. شخص واحد، ملكية كاملة، من النهاية إلى النهاية. شريحة الراتب تقع بين SRE ومهندس ML — قُل بين 140 ألفاً و220 ألف دولار حسب الجغرافيا.
قائمة فحص اليوم-الأول-للإنتاج
قبل أن يُطلَق أي وكيل، ينبغي أن يكون ما يلي موجوداً مسبقاً. SLO لزمن الاستجابة بميزانية مكتوبة. حد أدنى للدقة معبَّر عنه بمعدل نجاح التقييم لا بالحدس. سقف تكلفة لكل محادثة مع تنبيه عند 70٪ من الميزانية. تحديد معدل لكل مستخدم وحدسيات لاكتشاف إساءة الاستخدام. سياسة احتفاظ بسجل التدقيق تطابق أطول نافذة تنظيمية مطبَّقة — 12 شهراً لـ KVKK، أطول للقواعد القطاعية. إجراء استرجاع مُختبَر مرة واحدة على الأقل في بيئة الـ staging، ويُفضّل أن يكون بنموذج موجَّه مكسور عمداً لإثبات أن الاسترجاع يعمل فعلاً. مفتاح إيقاف موصول بقناة يصلها إنسان. لا شيء من هذا غريب. كل شيء منه مفقود في وكلاء الـ 79٪ — وهذا ليس صدفة.
مستويات OSP — كيف تبدو الخدمة
ثلاثة مستويات، مصممة لواقع السوق المتوسط حيث توظيف متخصص AgentOps يستغرق تسعة أشهر. مستوى Starter بـ 5 آلاف دولار شهرياً يغطي قياس المراقبة، ومراجعة تقييم أسبوعية، وتقرير تكلفة شهري، وترحيل نموذج واحد سنوياً. مستوى Standard بـ 10 آلاف يضيف توثيقاً مخصصاً للحوكمة، ومخرجات سياسة متوافقة مع ISO 42001، وتمارين Red Team ربع سنوية. مستوى Enterprise بـ 15 ألفاً يضم استجابة حوادث على مدار 24/7، وتطوير مجموعة تقييم مخصصة، وتقارير امتثال لـ KVKK وقانون الذكاء الاصطناعي الأوروبي. كل مستوى يأتي مع نفس لوحات التحكم الأساسية — Langfuse للتتبع، Phoenix للتقييمات، وقياس تكلفة مخصص فوقها. يحتفظ العملاء بلوحات التحكم حين تنتهي العلاقة. قفل المورّد استراتيجية بيع خاطئة في هذا السوق.
فريق التشغيل الذي لن تضطر لتوظيفه — بعد
الاقتصاد بسيط. متخصص AgentOps أول يكلّف 180 ألف دولار محمَّلة، يستغرق توظيفه ستة إلى تسعة أشهر، ويحتاج إلى سقالة أدوات وعمليات لا توجد بعد داخل معظم الشركات. عقد OSP يكلّف جزءاً من ذلك، ويبدأ في الأسبوع الأول، ويُسلّم نفس الأعمدة الخمسة بأدلة مُختبَرة في المعركة. حين يصل الدور الداخلي أخيراً — وسيصل، لأن كل نشر جدّي للذكاء الاصطناعي يتقارب نحو هذه الحاجة — يتحوّل العقد إلى تكليف بنقل المعرفة. تبقى لوحات التحكم. تبقى الأدلة. يحصل الموظف الجديد على طبقة تشغيل جاهزة للإنتاج في يومه الأول بدلاً من بنائها من الصفر. هذا هو العرض الفعلي: فريق التشغيل الذي لن تضطر لتوظيفه — بعد.