معًا، قمنا بتحسين استدلال DeepSeek R1 للنشر على GB200 NVL72 - مما يوفر زيادة بمقدار 2x و 3x لكل وحدة معالجة رسومية مقارنةً بمجموعات H100 التي تبلغ تقريبًا ضعف الحجم.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 9
أعجبني
9
7
مشاركة
تعليق
0/400
ProbablyNothing
· منذ 56 د
زيادة الأداء أنا ألعق ألعق
شاهد النسخة الأصليةرد0
WhaleWatcher
· 08-01 23:52
الأداء تضاعف مرة أخرى، مذهل!
شاهد النسخة الأصليةرد0
Rugpull幸存者
· 08-01 23:52
أنت تتحدث عن أداء卷 مرة أخرى، أليس كذلك؟
شاهد النسخة الأصليةرد0
OnChainDetective
· 08-01 23:52
همم تتبع تلك المقاييس الخاصة بوحدة معالجة الرسومات... هناك شيء غير متطابق هنا
نحن متحمسون لمشاركة نتائج تعاوننا مع SGLang. 🎉
معًا، قمنا بتحسين استدلال DeepSeek R1 للنشر على GB200 NVL72 - مما يوفر زيادة بمقدار 2x و 3x لكل وحدة معالجة رسومية مقارنةً بمجموعات H100 التي تبلغ تقريبًا ضعف الحجم.
هذه هي كيفية ظهور استدلال MoE في المقدمة.