الواجهة الرئيسيةتكنولوجيا واتصالات

تقديم بيئات تدريبية لتطوير وكلاء الذكاء الاصطناعى في وادى السيليكون

تتسابق شركات التكنولوجيا الكبرى في وادي السيليكون لتطوير وكلاء ذكاء اصطناعي قادرين على استخدام البرامج والتطبيقات وإنجاز المهام بشكل مستقل لكن التحدي الأكبر يكمن في كيفية تدريب هذه النماذج على مهام متعددة الخطوات.

وهنا تبرز تقنية البيئات التدريبية (Reinforcement Learning Environments – RL) باعتبارها حجر الأساس للجيل القادم من الذكاء الاصطناعي.

تشبه هذه البيئات ألعاب الفيديو البسيطة لكنها مخصصة لتدريب الوكلاء على مهام عملية مثل محاكاة متصفح كروم وطلب منتج من أمازون حيث يحصل الوكيل على “إشارة مكافأة” عند إنجاز المهمة بنجاح هذا النهج يتيح للنماذج اختبار قراراتها في بيئة تفاعلية بدلاً من الاعتماد على بيانات ثابتة فقط.

بحسب تقرير TechCrunch تتسابق شركات ناشئة مثل Mechanize Work و Prime Intellect لتقديم بيئات تدريبية متقدمة فيما تستثمر شركات ضخمة مثل Surge و Mercor مبالغ طائلة لتلبية الطلب المتزايد من مختبرات الذكاء الاصطناعي الكبرى مثل OpenAI و Anthropic و Google وتشير تقارير إلى أن Anthropic تدرس استثمار أكثر من مليار دولار في هذا المجال خلال العام المقبل.

شركات مثل Scale AI التي قادت سابقًا مجال تمييز البيانات تحاول اللحاق بالركب عبر بناء بيئات تدريبية لكنها تواجه منافسة شديدة بعد خسارة عقودها مع Google و OpenAI.

في المقابل تعرض Mechanize Work رواتب تصل إلى 500 ألف دولار للمهندسين لبناء بيئات أكثر قوة في إشارة إلى شراسة المنافسة وارتفاع سقف التوقعات.

إلى جانب اللاعبين الكبار أطلقت Prime Intellect مؤخرًا “مركز بيئات تدريبية” يشبه منصة Hugging Face لإتاحة هذه الأدوات لمجتمع المصادر المفتوحة مع توفير خدمات حوسبة مدفوعة لتدريب النماذج.

ورغم الحماس الكبير يشكك بعض الباحثين في قدرة هذه التقنية على التوسع بكفاءة محذرين من مشكلات مثل “التحايل على المكافآت” حيث قد يتعلم الوكيل خداع النظام بدلًا من إنجاز المهام المطلوبة.

مع ذلك يرى آخرون أن هذه البيئات قد تكون الطريق الأمثل لدفع قدرات الوكلاء إلى مستويات غير مسبوقة خاصة مع تراجع فعالية أساليب التدريب التقليدية.

محمد صبري

كاتب ومحرر صحفي بموقع نمبر1نيوز
زر الذهاب إلى الأعلى