موظفو OpenAI ينتقدون علنًا أن نتائج اختبار Grok3 الخاصة بالمعيار لديها طابع مضلل

robot
إنشاء الملخص قيد التقدم

أكد موظف في OpenAI مؤخرًا في تقرير البيانات الاقتصادية المالية ليوم 23 فبراير أن شركة xAI التابعة لإيلون ماسك قد أصدرت نتائج الاختبار الأساسي الخاص بنموذج الذكاء الاصطناعي الجديد Grok3 بشكل مضلل. وفي هذا الصدد، أكد إيغور بابوشكين، المؤسس المشارك لشركة xAI، أن الشركة لم ترتكب أي تصرف غير لائق. وتُظهر رسوم بيانية لـ xAI أن أداء نموذج Grok3 في اثنين من الإصدارات - Grok3 Reasoning Beta و Grok3 mini Reasoning - كان أفضل من النموذج القوي الحالي o3-mini-high في AIME 2025. ومع ذلك، لاحظ موظفو OpenAI بسرعة على منصة X أن رسوم بيانية xAI لم تشمل أداء o3-mini-high في AIME 2025 تحت شرط "cons@64". ودافع بابوشكين على منصة X بأن OpenAI سبق وأن أصدرت رسوم بيانية مضللة مماثلة في اختبارات الأداء الأساسية. على الرغم من أن هذه الرسوم البيانية تستخدم لمقارنة أداء نماذجها الخاصة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 2
  • مشاركة
تعليق
0/400
Birakenewekovip
· 02-23 03:48
السوق الصاعدة 🐂
شاهد النسخة الأصليةرد0
Renatinho25vip
· 02-23 02:47
استثمر 🚀
شاهد النسخة الأصليةرد0
  • تثبيت