广场
最新
热门
资讯
我的主页
发布
扫码下载 APP
更多下载方式
今天不再提醒
7213 Ejaaz
2025-08-11 15:07:09
关注
我无法理解为什么扎克花了150亿美元收购了来自ScaleAI的15名员工(数据公司)
所以我深入研究了一下,觉得我搞明白了:
我们并没有耗尽数据。实际上,情况正好相反。
一辆单一的无人驾驶汽车每小时产生2TB (的数据,相当于800,000本书)。
问题在于数据很混乱,不容易输入到LLM中进行训练,因此它就被扔进了数据墓地,留给其他人去解决(没有人去做)。
优秀数据工程师的严重短缺
我提到的那个墓地实际上是一个金矿,如果你能从中筛选出来的话。
问题是很少有人有能力或时间。猜测这就是扎克伯格为scaleAI员工支付150亿美元的原因。
高质量数据远比“数据量”更有价值
特别是针对训练后模型 (eg 测试时间计算)。
它还需要更少的计算,这降低了训练模型的成本。
所以如果你的训练团队能够 1. 筛选高质量数据 2. 将其注入后续训练 3. 降低成本 - 你就会赢得人工智能竞赛 (无价)。
GET
-1.4%
WHY
-8.9%
DEEP
-6.91%
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
赞赏
点赞
评论
转发
分享
评论
0/400
评论
暂无评论
话题
#
Gate七月透明度报告发布
6k 热度
#
BTC ETF持仓破1530亿美元
10k 热度
#
美联储终止新型活动监管
9k 热度
#
Bit Digital成功转型
5k 热度
#
ETH 热浪战队争霸赛来袭
986 热度
置顶
网站地图
我无法理解为什么扎克花了150亿美元收购了来自ScaleAI的15名员工(数据公司)
所以我深入研究了一下,觉得我搞明白了:
我们并没有耗尽数据。实际上,情况正好相反。
一辆单一的无人驾驶汽车每小时产生2TB (的数据,相当于800,000本书)。
问题在于数据很混乱,不容易输入到LLM中进行训练,因此它就被扔进了数据墓地,留给其他人去解决(没有人去做)。
优秀数据工程师的严重短缺
我提到的那个墓地实际上是一个金矿,如果你能从中筛选出来的话。
问题是很少有人有能力或时间。猜测这就是扎克伯格为scaleAI员工支付150亿美元的原因。
高质量数据远比“数据量”更有价值
特别是针对训练后模型 (eg 测试时间计算)。
它还需要更少的计算,这降低了训练模型的成本。
所以如果你的训练团队能够 1. 筛选高质量数据 2. 将其注入后续训练 3. 降低成本 - 你就会赢得人工智能竞赛 (无价)。