Мы рады поделиться результатами нашего сотрудничества с SGLang. 🎉



Вместе мы оптимизировали вывод DeepSeek R1 для развертывания на GB200 NVL72 — что обеспечило увеличение производительности на 2x и 3x на GPU по сравнению с кластерами H100 почти в два раза большими.

Вот как выглядит фронтовое MoE инференс.
LOOKS-0.92%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 7
  • Поделиться
комментарий
0/400
ProbablyNothingvip
· 8ч назад
Увеличение производительности Я лизнул, я лизнул
Посмотреть ОригиналОтветить0
WhaleWatchervip
· 08-01 23:52
Производительность снова удвоилась, впечатляет!
Посмотреть ОригиналОтветить0
Rugpull幸存者vip
· 08-01 23:52
Опять прокручивается производительность, да?
Посмотреть ОригиналОтветить0
OnChainDetectivevip
· 08-01 23:52
хм, я проследил за этими метриками GPU... что-то здесь не сходится
Посмотреть ОригиналОтветить0
MetaverseVagabondvip
· 08-01 23:50
Вот это да, наконец-то я прошёл H100!
Посмотреть ОригиналОтветить0
ClassicDumpstervip
· 08-01 23:46
Снова на луну, да?
Посмотреть ОригиналОтветить0
WhaleMinionvip
· 08-01 23:36
Производительность GPU взорвалась.
Посмотреть ОригиналОтветить0
  • Закрепить