OpenAI o1对国内大模型有何影响?姜大昕、杨植麟和朱军这样看

2024-09-20 17:38:56 家弼 人气值:350

图片来源:界面图库

界面新闻记者 | 伍洋宇

界面新闻编辑 | 宋佳楠

当GPT-5屡次跳票引发质疑声后,OpenAI用o1及时托住了行业对大模型以及AGI(通用人工智能)的信心。

相较于更单维度注重参数堆积、不断推进Scaling Law的GPT系列大模型,o1改变了技术策略,加入了强化学习,以思维链等方式大幅提升了模型的推理能力,并且一定程度上缓解了该领域对于“数据墙”的焦虑。

面对OpenAI的这一动作,外界普遍好奇的是,它是否会影响中国大模型领域的技术发展走向??

9月19日,在2024云栖大会上,阶跃星辰创始人兼CEO姜大昕、月之暗面Kimi创始人杨植麟,以及生数科技首席科学家朱军,以“通往AGI的大模型发展之路”为主题进行了一场圆桌对话。?

姜大昕表示,AI发展正在经历关键的技术范式迭代。OpenAI的大模型o1探索出了通过强化学习让AI具备人类慢思考(可主动反思、纠错的复杂思考)能力的方式,接下来提升强化学习模型的泛化能力和加速推进多模态理解生成一体化是AI技术进一步突破的关键。

在他看来,o1是大模型首次同时具备人类大脑System 1(即快思考,直接给出答案)和System 2 (即慢思考)的能力,这是大模型开始具备归纳世界能力的关键一步。

除此以外,对于业界热议的AGI进程变缓的观点,姜大昕判断过去18个月以来,AGI的发展并没有减速,反而是在加速。“我们把AGI的实现路径划分为模拟世界、探索世界和归纳世界三个可并行的发展阶段,过去一年这三点都出现了突破性的技术进展,发展速度可以说是AI一日,人间一年。”

按照他的观点,除了o1在归纳世界上的进展,GPT-4o标志着多模融合的进步,是更好地对物理世界建模、彻底实现模拟世界的基础。而在探索世界上,特斯拉发布的完全自动驾驶系统FSD V12,为具身智能设备如何与大模型结合,从数字世界走向探索物理世界指明了技术方向。?

杨植麟则从纵向的智商提升和横向的模态拓展给出了自己的看法,同样认为AI整体处于加速发展的状态。他指出,o1的主要意义在于提升了AI的上限。在这一点上,Scaling Law是过去唯一有效的准则,但在数据挖掘遭遇瓶颈时,以Scaling Law为代表的原有范式已经遇到问题,而强化学习和大语言模型的结合,很大程度上解决了下一步Scaling Up的问题,“至少证明了它初步可行”。

杨植麟认为,这也会对产业格局以及创业公司产生影响。其中一个关键点是,此后训练算力和推理算力的比例会发生变化,这个变化的本质可能给创业公司带来新机会。一方面,如果存在算力门槛,创业公司可以进行算法的基础创新,以取得基础模型上的突破;另一方面,算力相对小的公司可以通过后训练的方式在部分领域达成某种效果,这里将会产生更多产品和技术机会。?

o1带给大模型的新思考是,当强化学习加入大模型成为新的技术范式,如何从细分领域逐步实现它的泛化能力?

朱军认为,o1的技术实现路径并没有披露这一点,但从科研的角度可以看到,这当中过程监督的数据变得十分重要。它和直接从结果监督的数据不一样,是要对思考过程的每一步进行标注,这种数据由于需要专业人士投入因而具备一定获取难度和高价值。?

另外,具体的技术实现上也存在一定困难。在此之前,走强化学习路线的DeepMind就有类似的泛化问题,例如从AlphaGo到AlphaFold再到AlphaGeometry,都是针对特定场景进行设计。

朱军强调,这背后的本质逻辑是,在强化学习中,面对更泛化和更开放的场景,Reward Model(奖励模型,用于评估智能体的行为表现,并指导其学习过程)变得难以定义,这也是o1背后的技术新范式在泛化过程中要解决的核心问题之一。

不过,通过结合已经比较强大的基座,这套新范式相比上一代AlphaGo迁移到其他领域里会更快,在更好的开放领域模拟器等技术加持下,他相信新范式的泛化进程会比之前更容易取得效果和提升。

只是这条新范式泛化之路的不确定性,及其对应的可探索空间和可能性,究竟对创业公司而言是好事还是坏事?

杨植麟直言,这是一个很好的机会,它等同于一个新的技术维度和技术变量。这个过程之中,除了如何泛化,还有很多基础的技术问题尚待解决,例如训练和推理两个层面要同时Scaling up,这当中还有诸多细节没有探索清楚,包括过程监督、幻觉对模型效果的影响等等。这背后存在的技术创新将形成一些突破机会。

姜大昕同样认为新范式的技术创新将带来新机会,但算力将是一个挑战,因为当创业公司追求一个通用性能够泛化的推理模型时,算力的需求一定是巨大的。

如果我们所要追求的目标就是AGI的话,你付出再多也还是要坚持下去。”姜大昕说。

更多内容: 玩家风采 开发者访谈

查看网游世界大全

游戏故事背景相关
热门标签
本周人气攻略
48小时热点资讯
精品网页游戏
  • 美国7月新屋开工总数年化123.8万户:低于预期133万户
  • 【锚定现代化改革再深化·走市县看落实】红船启航地就业谱新篇——浙江省嘉兴市创新实践全力推进高质量充分就业
  • 加沙地带确认一例脊髓灰质炎病例
  • 北京大学人民医院青岛医院开展第七个中国医师节系列活动
  • 省委常委会召开会议徐麟主持并讲话李炳军赵永清时光辉等参加
  • 最高检:依法严惩财务造假犯罪维护资本市场健康发展
  • 市十八届政府第53次常务会议召开
  • 哈里斯承诺降低物价聚焦美国中产阶级
  • 统一不用再等了!赖清德最怕来了,大陆换了打法,美国也帮不了
  • 中东火环六国围以殊死一战!"
  • 福建省人民政府领导成员最新分工公布
  • 中国顶级布局:中老柬铁路落地,越南梦碎,泛亚铁路统筹东南亚
  • 广西一景区设施故障
  • 难以置信!一男子代表国人向日本鞠躬道歉,画面曝光,网友怒了!
  • 重庆两名干部被“双开”
  • 福建省人民政府领导成员最新分工公布
  • 【重点关注】全面准确理解《决定》的思想指引
  • 《望中东和平》巴以纷争战火燃中东渴盼共安然公平正义常相伴联合方能止乱渊#以巴爆发大规模冲突造成严重伤亡
  • 泄洪口抓鱼被吸涵洞
  • 最高人民法院党组成员、政治部主任李成林参加王佳佳法官遗体告别仪式并看望慰问家属
  • 漯河市市长黄钫调研城市建设者管理者之家、人才公寓和“断头路”打通项目建设情况
  • 印度女实习医生被奸杀引发全国抗议,至少30万医护人员走上街头!莫迪发声
  • 婚姻登记取消户口簿会导致重婚、骗婚?民政部回应!
  • 台媒和台网友力挺长荣!我们要把酒店订爆
  • 贝东丹当选泰国总理后首发言!感谢赛塔所做的贡献!
  • 昨天是“全国生态日”全市各地举办多彩活动带你认识“松松”与“绿友友”两个新朋友
  • 老头一个行为惹怒仙女,当街就开始发飙,疯疯癫癫直接把老登整服
  • [时习之·一席话]共绘美丽中国新画卷
  • Meta广告管控失职失责,19名美国议员联合质询扎克伯格
  • 关于本站 | 广告合作 | 人才招聘 | 友情链接 | 联系我们 | 网站地图 | | 虚拟货币指南| 玩家对战视频| 游戏剧情解析| 官方公告| 直播频道| 游戏bug反馈 投诉建议 | 版权保护投诉指引
    CopyRight 1999-2025 ALi213.Net All Right Reserved 版权所有 | 苏ICP备2023535724