全网免费中文无码字幕,国产99久9在线视频 ,亚洲成av片在线播放,欧美日韩国产成人一区二区

全球科研团队竞逐低成本AI模型研发新范式

全球科研团队竞逐低成本AI模型研发新范式

linwanting 2025-03-05 在线选购 3 次浏览 0个评论

美国斯坦福大学等机构研究团队近日宣布,在基座大模型基础上,仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心(OpenAI)开发的o1、中国深度求索公司的DeepSeek-R1等,但此类尝试意味着企业可以较低成本研发出适合自身的AI应用,AI普惠性有望增强。同时,其所应用的“测试时扩展”技术或代表一条更可持续的AI研发路径。

低成本玩转高级推理

美国斯坦福大学和华盛顿大学研究团队近日宣布研发出名为s1的模型,在衡量数学和编码能力的测试中,可媲美o1和DeepSeek-R1等。研究团队称,训练租用所需的计算资源等成本只需约几十美元。

s1的核心创新在于采用了“知识蒸馏”技术和“预算强制”方法?!?#30693;识蒸馏”好比把别人酿好的酒进一步提纯。该模型训练数据是基于谷歌Gemini Thinking Experimental模型“蒸馏”出的仅有1000个样本的小型数据集。

“预算强制”则使用了AI模型训练新方法——“测试时扩展”的实现方式。“测试时扩展”又称“深度思考”,核心是在模型测试阶段,通过调整计算资源分配,使模型更深入思考问题,提高推理能力和准确性。

“预算强制”通过强制提前结束或延长模型的思考过程,来影响模型的推理深度和最终答案。s1对阿里云的通义千问开源模型进行微调,通过“预算强制”控制训练后的模型计算量,使用16个英伟达H100 GPU仅进行26分钟训练便达成目标。

全球科研团队竞逐低成本AI模型研发新范式

美国加利福尼亚大学伯克利分校研究团队最近也开发出一款名为TinyZero的精简AI模型,称复刻了DeepSeek-R1 Zero在倒计时和乘法任务中的表现。该模型通过强化学习,实现了部分相当于30亿模型参数的大语言模型的自我思维验证和搜索能力。团队称项目训练成本不到30美元。

“二次创造”增强AI普惠性

清华大学计算机系长聘副教授刘知远接受记者采访时说,部分海外研究团队使用DeepSeek-R1、o1等高性能推理大模型来构建、筛选高质量长思维链数据集,再用这些数据集微调模型,可低成本快速获得高阶推理能力。

相关专家认为,这是AI研发的有益尝试,以“二次创造”方式构建模型增强了AI普惠性。但有三点值得注意:

首先,所谓“几十美元的低成本”,并未纳入开发基座大模型的高昂成本。这就好比盖房子,只算了最后装修的钱,却没算买地、打地基的钱。AI智库“快思慢想研究院”院长田丰告诉记者,几十美元成本只是最后一个环节的算力成本,并未计算基座模型的预训练成本、数据采集加工成本。

全球科研团队竞逐低成本AI模型研发新范式

其次,“二次创造”构建的模型,整体性能尚无法比肩成熟大模型。TinyZero仅在简单数学任务、编程及数学益智游戏等特定任务中有良好表现,但无法适用于更复杂、多样化的任务场景。而s1模型也只能通过精心挑选的训练数据,在特定测试集上超过早期版本o1 preview,而远未超过o1正式版或DeepSeek-R1。

最后,开发性能更优越的大模型,仍需强化学习技术。刘知远说,就推动大模型能力边界而言,“知识蒸馏”技术意义不大,未来仍需探索大规模强化学习技术,以持续激发大模型在思考、反思、探索等方面的能力。

AI模型未来如何进化

在2025年美国消费电子展上,美国英伟达公司高管为AI的进化勾画了一条路线图:以智能水平为纵轴、以计算量为横轴,衡量AI模型的“规模定律”呈现从“预训练扩展”、到“训练后扩展”,再到“测试时扩展”的演进。

“预训练扩展”堪称“大力出奇迹”——训练数据越多、模型规模越大、投入算力越多,最终得到AI模型的能力就越强。目标是构建一个通用语言模型,以GPT早期模型为代表。而“训练后扩展”涉及强化学习和人类反馈等技术,是预训练模型的“进化”,优化其在特定领域的任务表现。

全球科研团队竞逐低成本AI模型研发新范式

随着“预训练扩展”和“训练后扩展”边际收益逐渐递减,“测试时扩展”技术兴起。田丰说,“测试时扩展”的核心在于将焦点从训练阶段转移到推理阶段,通过动态控制推理过程中的计算量(如思考步长、迭代次数)来优化结果。这一方法不仅降低了对预训练数据的依赖,还显著提升了模型潜力。

三者在资源分配和应用场景上各有千秋。预训练像是让AI模型去学校学习基础知识,而后训练则是让模型掌握特定工作技能,如医疗、法律等专业领域?!?#27979;试时扩展”则赋予了模型更强推理能力。

编辑:李华山

转载请注明来自石家庄天鲲化工设备有限公司 ,本文标题:《全球科研团队竞逐低成本AI模型研发新范式》

百度分享代码,如果开启HTTPS请参考李洋个人博客
每一天,每一秒,你所做的决定都会改变你的人生!

发表评论

快捷回复:

验证码

评论列表 (暂无评论,3人围观)参与讨论

还没有评论,来说两句吧...

Top
 最新临沂疫情  最新疫情水貂  木兰最新改动  白鸽最新搭档  化州最新冠  最新管理感悟  最新影院伦  最新塑钢价格  澜沧最新疫情  最新疫情溯源  最新铜报价  最新迅雷哥  各国最新灾情  家具最新流行  最新病菌症状  最新并列情况  最新汪涵  时王最新  最新故宫事  秘密教学最新  峰哥最新  国内最新软卧  最新养猪利润  导航最新入口  陇南最新疫情  最新复工规定  政治最新题  进贤最新新  最新麻雀机  筋膜炎最新 
凤台县| 南江县| 股票| 阿城市| 湘西| 宣汉县| 息烽县| 弋阳县| 河北区| 成安县| 河源市| 深泽县| 岳普湖县| 隆林| 隆回县| 福清市| 弥勒县| 蒲江县| 庆云县| 万源市| 本溪| 龙游县| 大渡口区| 上栗县| 儋州市| 任丘市| 兴业县| 尖扎县| 文安县| 靖江市| 博兴县| 通海县| 太和县| 遂川县| 隆尧县| 乐平市| 仁怀市| 汉源县| 富源县| 阿合奇县| 侯马市|