EX平台消息：o3崛起，但推理模型离「撞墙」只剩一年？

发表评论

A+

所属分类：新闻

摘要

　　来源：新智元报道　　编辑：英智　　[新智元导读]OpenAI的o3推理模型席卷AI界，算力暴增10倍，能力突飞猛进！但专家警告：最多一年，推理模型可能一年内撞上算力资源极限。OpenAI还能否带来惊喜？

EX外汇资讯：

　　来源：新智元报道

　　编辑：英智

　　[新智元导读]OpenAI的o3推理模型席卷AI界，算力暴增10倍，能力突飞猛进！但专家警告：最多一年，推理模型可能一年内撞上算力资源极限。OpenAI还能否带来惊喜？

　　最多一年，推理模型就会撞上训练算力的‘天花板’。

　　OpenAI的o3这样的推理模型，诞生还不到一年，能力已经突飞猛进。OpenAI的研究人员非常乐观地认为，这种趋势会持续下去。

　　但状况来了：推理模型到底还能进步到什么程度？

　　Epoch AI是一个独立的AI研究团队，专注于对大模型的发展速度、发展轨迹以及可能产生的社会影响进行前瞻性研究。

　　他们认为，推理模型确实还有进步空间，但想让OpenAI或者其他顶尖AI公司实现‘指数级大飞跃’，基本不太可能。

　　按现在的节奏，每几个月计算能力翻10倍（就像o1到o3那样），估计最多一年就会撞墙。

　　到2026年，扩展速度将会放缓，回落到每年4倍的增速水平，模型的升级速度也会跟着变慢。

　　如果类似o1到o3这样的规模提升持续下去，推理计算资源增长的可能轨迹

　　研究的主要线索如下：

　　o3的训练算力是o1的10倍，基本是指推理训练阶段，o3在o1发布4个月后就推出了。
　　虽然不知道o1具体用了多少算力，但DeepSeek-R1允许用来参考。
　　英伟达的Llama-Nemotron、微软的Phi-4-reasoning，也透露出一些训练细节。
　　Anthropic CEO Dario Amodei也发表过相关看法。

　　前沿推理模型得烧多少算力？

　　OpenAI的o3和其他推理模型，都是从传统大语言模型发展而来的。

　　最实行，模型会用海量人工标注数据进行‘预训练’；然后进入强化学习阶段，通过反馈优化模型应对难题的能力，这就是‘推理训练’。

　　从历史上看，算力是AI发展的关键。

　　故而得搞清楚：现在推理训练到底用了多少算力？还能增加多少，这又会怎么影响模型的能力？

　　虽然推理模型在AI圈火得一塌糊涂，但推理模型的推理训练算力的公开信息却很少。

　　从o1到o3：推理算力翻了十倍

　　OpenAI发过一张图，对比o1和o3在AIME基准测试的表现，横轴是推理训练的算力。

　　它表明，o3的训练算力是o1的10倍。

　　摘自OpenAI的o3直播发布会

　　为啥说横轴不是总算力？

　　缘于o1早期版本的算力比o3少4个数量级，但AIME得分也有25%，要是算总算力，这个成绩就太离谱了。

　　此外，如果横轴是总计算资源，就意味着OpenAI训练了许多预训练阶段高度不完整的o1版本。

　　OpenAI研究员最近也透露，公司接下来打算重点发展强化学习，投入的计算资源会比训练初始模型时还要多。

　　o3具体用了多少算力？目前没实锤，得从其他模型和业内人士的话里找线索。

　　来自DeepSeek-R1的见解

　　大部分AI公司都把训练细节捂得严严实实，但DeepSeek大方公开了R1的数据：

　　DeepSeek-R1在强化学习阶段花了6×10²³次浮点运算（成本约100万美元），生成了2万亿个token，大约是基础模型DeepSeek-V3预训练成本的20%。

　　这个数据虽然有误差，但仍然很有帮助，DeepSeek-R1和o1水平差不多，可作为基准。

　　不过，由于各种原因，DeepSeek-R1的推理算力可能与o1不同。两个模型参数量、计算效率都不一样，故而结果仅供参考。

　　其他推理模型的启示

　　英伟达的Llama-Nemotron Ultra 253B和微软的Phi-4-reasoning也公开过数据：

　　Llama-Nemotron Ultra：强化学习阶段用了14万小时H100算力（约1×10²³次浮点运算），不到基础模型预训练成本的1%。
　　Phi-4-reasoning：推理阶段规模更小，生成4.6亿个token，计算成本不到1×10²⁰次浮点运算，算力消耗不到预训练的0.01%。

　　这两个模型在基准测试中都取得了出色的成绩，Llama-Nemotron的成绩与DeepSeek-R1和o1相当。

　　但它们在强化学习阶段之前都做了‘监督微调’，用了大量其他推理模型生成的高质量推理链示例，和o1、o3这种前沿模型的训练逻辑不太一样，参考价值有限。

　　业内大佬怎么看？

　　总体而言，这些信息对于了解o1或o3的训练算力规模帮助有限。

　　有一点允许确定：像Phi-4这样的某些模型，推理训练计算资源（至少在强化学习阶段）可能相对较少。

　　这并不意味着o3也是用同样少的计算资源进行训练的，但这确实表明，仅从一个推理模型在基准测试中表现良好，很难判断其推理算力的规模。

　　此外，传统的监督微调在推理模型的开发中可能发挥着不可忽视作用。由于训练方法多种多样，在没有公开训练细节的情况下，很难猜测推理模型的推理训练规模。

　　Anthropic CEO Dario Amodei今年1月提到：

责任编辑：过博文

　　[文/观察者网刘程辉]在特朗普的关税高压下，沃尔玛等美国零售巨头一度要求中方承担关税成本，在遭中方约谈后，方才通知中国供应商恢复发货，并同意美方承担全部关税成本。

　　然而事情似 EX官网乎有了新变数。

　　香港英文媒体《南华早报》5月30日援引行业消息人士的话披露，面对美国国内“自行消化关税成本”的压力，沃尔玛、塔吉特、耐克、彪马和阿迪达斯等零售品牌现在正要求中国及东南亚供应商分摊大部分高额关税，承担美国进口关税成本的50%至66%。

　　根据消息人士的说法，目前谈判仍在进行中，关税成本如何分摊的细节尚未确定。许多中国供应商表示难以承担如此高的成本分摊，一些零售商也在调整供应链，部分品牌已经表示将提高产品价格。

　　报道称，美国零售商与中国供应商就如何分摊关税成本已进行了数周的谈判，美国公司面临着国内巨大政治压力，要求他们“自行消化关税”以保持价格稳定。

　　尽管沃尔玛等美国主要零售商曾同意承担全部关税成本，但一些向沃尔玛、塔吉特、耐克、彪马和阿迪达斯等公司供货的供应商消息人士称，包括几家美国零售巨头在内的全球品牌，如今正推动中国和东南亚部分地区的供应商承担大部分关税成本。

　5月14日，美国加利福尼亚州洛杉矶，顾客在沃尔玛商店购物。视觉中国

　　一家从中国和东南亚采购并销售至美欧的服装供应商的高管说：“本站大多数向大型零售商和品牌出口的服装供应商客户，都被要求承担当前关税的50%至66%。”

　　消息人士强调，谈判仍在进行，具体如何分摊关税成本尚未最终确定，双方仍在持续沟通，试图在这个“艰难时期”找到应对方案。

　　5月12日，中美贸易代表在瑞士日内瓦达成协议，双方同意在90天内大幅降低关税，将税率下调115%。

　　但一些中国供应商表示，他们难以承担当前被要求分摊的额外成本，尤其是在中美倘若未能达成协议的情况下。

　　外界预测，如果中美未能在8月12日前达成协议，关税税率可能重新飙升至三位数水平。

　　浙江省一家文具制造商的消息人士告诉《南华早报》，他们一直在与沃尔玛等美国零售商讨论“关税休战”之后的“应急预案”。

　　根据沃尔玛之前与这家文具制造商达成的协议，沃尔玛将承担8月前的全部关税成本，但沃尔玛尚未下达8月后的订单。

　　这名消息人士表示，他们最多允许承担约30%的额外关税成本，但“绝无可能”承担50%或以上的关税。该制造商目前尚未与沃尔玛达成协议。

　　消息人士补充道：“本站做好了最坏的打算，同时抱有最好的希望。”

　　对于上述消息，沃尔玛、塔吉特、耐克、彪马和阿迪达斯均未立即回应《南华早报》的置评请求。

　　3月11日，就沃尔玛要求中国供应商大幅降价一事，中国商务部等有关部门约谈沃尔玛，了解有关情况。有专家指出，沃尔玛此举有违反商业合同的可能，将扰乱正常的市场交易秩序。

　　4月24日，“沃尔玛中国”微信公众号发布消息称，为积极响应内外贸一体化发展的号召，沃尔玛为符合条件的外贸企业开设绿色通道，简化准入流程、加快审批效率，助力相关企业迅速开拓国内市场。

　　美媒认为，沃尔玛这一积极响应中国政府号召的计划，旨在“帮助中国出口商在国内销售商品”，也是“为了平衡此前要求中国供应商（大幅降价）承担部分关税上调代价的做法”。

　　《南华早报》4月29日称，沃尔玛已通知部分中国供应商恢复发货。据报道，宁波一家文具和办公用品出口商收到沃尔玛关于恢复对美正常发货的通知。该公司表示，新关税的成本将由美方买家承担。

　　《南华早报》注意到，一些中国供应商希望通过出口转内销对冲关税影响，但由于国内外市场产品规格和种类存在差异，这么做并非易事。一名分析人士举例说，在美国市场出售的裤子长度往往比国内的长，美国热销的烤箱手套、圣诞贺卡等产品，国内消费需求也不大。

　　另一边，美国零售商正面临不涨价的政治压力。沃尔玛首席执行官道格·麦克米伦5月15日警告称，沃尔玛无法承担贸易战的所有成本，将被迫提高产品售价。两天后，特朗普公开施压称关税成本必须由沃尔玛和中国承担。

　　5月21日，耐克宣布将实行提价以抵消美国关税带来的高昂成本；德国运动服装品牌彪马则调整供应链，削减中国直发美国货量，但不排除涨价可能；阿迪达斯4月29日声明称“尚未最终决定”对策，但“关税推高成本终将转嫁为涨价”；塔吉特CEO布莱恩·康奈尔5月21日表示涨价是应对高关税的“最后手段”。

　　美国财政部长贝森特18日在接受采访时表示，沃尔玛将自行消化部分关税，但他也承认，一部分加征关税的成本最终会落到消费者头上。

　　值得注意的是，中美达成关税协议后的两周时间里，特朗普政府不仅变本加厉扩大对华芯片限制，还放狠话撤销中国学生签证，种种行径严重破坏双方达成的共识。

　　5月30日，外交部发言人林剑主持例行记者会。法新社记者提问，美国财长贝森特在接受福克斯新闻采访时表示，与中国的贸易谈判有点停滞，并暗示可能需要中美两国领导人的参与。中方对此如何看待？外交部能否介绍贸易谈判的最新进展？中方是否仍有信心与美国达成贸易协议？

　　对此，林剑表示：“中方已多次阐明了在关税状况上的立场，具体状况建议已向中方的主管部门询问。”

点击进入专题：

中美会谈后贸易恢复

责任编辑：张玉

发表评论取消回复

登录 找回密码

登录找回密码