تابعنا

StepFun AI تطلق Step‑DeepResearch: نموذج ذكاء اصطناعي جديد لإحداث ثورة في البحث العميق

StepFun AI تطلق Step‑DeepResearch: نموذج ذكاء اصطناعي جديد لإحداث ثورة في البحث العميق

أعلنت شركة StepFun AI عن إطلاق نموذجها الجديد Step‑DeepResearch، وهو وكيل بحث عميق شامل (End-to-End) يضم 32 مليار معامل، مبني على أساس Qwen2.5-32B-Base، بهدف تحويل مهام البحث العادية إلى عمليات بحث متقدمة تتطلب تفكيراً طويلاً واستخدام أدوات متقدمة، مع الحفاظ على تكلفة استدلال منخفضة نسبيًا.

يعيد هذا النموذج تعريف البحث العميق كعملية اتخاذ قرار تسلسلي، حيث يدمج أربع قدرات أساسية داخل وكيل واحد بدلاً من الاعتماد على تنسيق عدة وكلاء خارجيين. تشمل هذه القدرات التخطيط وتفكيك المهام، البحث المتعمق عن المعلومات، التأمل والتحقق، وأخيراً إنتاج تقارير احترافية مدعومة بالاستشهادات.

لتحقيق ذلك، قام الفريق ببناء مجموعات بيانات تدريب منفصلة لكل قدرة أساسية. فالتخطيط اعتمد على استخلاص خطط بحث واقعية من تقارير فنية ومالية، بينما تم توليد بيانات البحث العميق عبر استفسارات معقدة من قواعد معرفية ضخمة مثل Wikidata5m. أما التأمل والتحقق، فقد تم توليده عبر حلقات تصحيح ذاتي لضمان الجودة.

عملية التدريب مرت بثلاث مراحل رئيسية: التدريب المتوسط (Mid-training) لإدخال القدرات الأساسية ضمن سياق كبير (يصل إلى 128k)، ثم الضبط الدقيق الموجّه (SFT) لتركيب مسارات البحث الكاملة، وأخيراً التعلم المعزز (RL) باستخدام PPO ومحكم معياري دقيق لتحسين جودة التقارير النهائية.

يعمل النموذج عند الاستدلال كنظام ReAct موحد، يتنقل بين التفكير واستدعاء الأدوات والملاحظات. تشمل الأدوات المتاحة البحث الجماعي على الويب، إدارة المهام، وأوامر Shell داخل بيئة آمنة (Sandbox). كما يستخدم مكدس بحث خاص يوفر وصولاً لأكثر من 20 مليون ورقة بحثية عالية الجودة، ويعتمد على تصنيف سلطة لتفضيل أكثر من 600 نطاق موثوق لضمان دقة المصادر.