算力服务:大模型时代的新商机与挑战

robot
摘要生成中

算力服务:大模型时代的新商业模式

大模型训练带来的算力需求激增,使算力正在成为一种新的商业模式。虽然当前行业对高端GPU的抢夺热潮终将过去,但算力服务商需要未雨绸缪,及时调整战略方向。

近期,有研究人员利用全球40年的天气数据,使用200张GPU卡进行为期2个月左右的预训练,成功训练出了参数量达亿级的气象大模型。按照每小时7.8元/GPU的计算成本,该模型的训练成本可能超过200万元。而如果是训练通用大模型,成本可能还要翻百倍。

目前中国已有超过100个10亿参数规模的大模型。然而,行业蜂拥而上的大模型"炼丹"热潮却面临着高端GPU短缺的困境。算力成本高企,资金和算力短缺成为摆在行业面前最直观的问题。

高端GPU的短缺在全行业普遍存在。大模型需求爆发导致市场对算力需求快速增长,但供给量增速远远跟不上。虽然长远来看算力供给一定会从卖方市场进入买方市场,但这个过程还需要一段时间。

各家企业都在盘算自己手中的GPU数量,并以此来判断市场份额。有专家认为,如果没有数十亿资金支持,很难持续做大模型。许多创业者也表示,如果没有充足资金支撑,这条路很难走通。

面对这一局面,业内普遍认为,随着大模型市场竞争加剧,市场也将从狂热回归理性,企业也会根据预期变化来控制成本、调整策略。

为应对算力短缺,企业纷纷采取多种措施:

  1. 使用更高质量的数据进行训练,提升训练效率。
  2. 提升基础架构能力,实现千卡以上稳定运行。
  3. 优化算力卡资源调度,提高利用率。
  4. 改善网络性能,提高训练速度。
  5. 从云计算架构过渡到超算架构,降低成本。
  6. 使用国产平台替代英伟达GPU。

对于中小企业而言,选择专业的算力服务商可能是更好的选择。千卡级别的GPU集群才能产生规模效应,而算力服务商可以提供边际成本为零的服务。

算力正在成为一种新的服务模式。《2023算力服务白皮书》将算力服务定义为:以多样性算力为基础,以算力网络为链接,以供给有效的算力为目标的算力产业新领域。

算力服务的本质是通过新计算技术实现异构算力统一输出,并与云、大数据、AI等技术融合。它不仅包括算力,还包括存储、网络等资源的统一封装,以API等形式完成算力交付。

在算力产业链中,上游企业主要供给算力基础资源,中游企业负责算力生产和供给,下游企业则是算力服务的使用者。

目前,按量计费和包年包月是算力服务的主流计费模式。行业也在推进"算网一体化融合",支持跨架构、跨地域、跨服务商的算力调度。

随着大模型高性能计算需求常态化,算力服务正快速形成独特的产业链和商业模式。尽管当前面临高端GPU短缺、成本高企等挑战,但长远来看,算力服务将成为确定性趋势。算力服务商需要未雨绸缪,为市场变化做好准备。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 3
  • 分享
评论
0/400
资深空投收割机vip
· 07-04 07:01
生意能干 就是成本高
回复0
FunGibleTomvip
· 07-04 07:00
有钱也买不到好卡
回复0
跨链深呼吸vip
· 07-04 06:34
就卖GPU吧!
回复0
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)