类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
97128
-
浏览
134
-
获赞
91
热门推荐
-
啥情况恩佐和凯塞多同时注销推特账号,疑似遭到蓝军球迷网暴
2月3日讯 北京时间今早,切尔西中场恩佐和凯塞多都注销了自己的推特账号。目前,已经无法在推特上搜索到两人的账号。两人注销社交媒体的具体原因还不清楚。有不少球迷和媒体表示,在切尔西不敌利物浦的比赛后,众雷雨天气案例联合复盘 提升空管协作保障水平——民航宁夏空管分局开展雷雨保障联合复盘分析会
为深入贯彻落实民航局、民航局空管局、西北空管局关于加强雷雨季节颠簸、强降雨等危险天气运行保障的要求,更好地总结积累雷雨季节保障经验,提升应急处置能力,8月5日,宁夏空管分局组织管制、技保、气象及为宁波机场点赞!“阳光”,让城市更有温度
“......作为一名宁波人,看到这充满人情味的传递,感觉宁波有着其他城市没有的温暖。宁波机场和地铁站都很赞!”8月7日夜晚,“宁波民生e点通”群众留言东航江西分公司举办“幸福从心出发 同心共迎二十大”心理辅导讲座
为贯彻落实东航集团中期工作会议要求,实现“稳安全、稳经营、稳队伍的”目标任务,提高员工自我调节能力,8月9日,东航江西分公司工会开办了“幸福从心出发 同心共迎二十大集团荣获“国家知识产权示范企业”称号
12月10日,国家知识产权局发布《关于确定2015年度国家知识产权示范企业和优势企业的通知》,确认集团荣获“国家知识产权示范企业”称号。“国家知识产权示范企业&rd温州诚达航空服务有限公司举办环境与健康保护专题讲座
为进一步提升环保意识,普及卫生知识,倡导绿色健康生活,7月14日下午,温州诚达航空服务有限公司特邀中国环境保护产业协会新生活环境保护与治理中心的专家焦颖秋,为员工做环境与健康保护的专题讲座。焦颖秋老师阿勒泰雪都机场开展疫情防控知识实操培训 抓实抓细疫情常态化防控工作
通讯员 丁婧 魏恒)为有效应对当前严峻复杂的疫情防控形势,进一步提升阿勒泰雪都机场员工的个人防护能力和规范处置水平,推动各项防控政策和措施要求的落实。近日,阿勒泰雪都机场组织机场各部门、各驻场外鹿鼎记中在深宫长大的建宁公主是个怎样的人?
经典古装剧鹿鼎记,一直受到大众的喜爱,不同版本里的人物也各有风格特点。邱淑贞,刘玉翠,舒畅和娄艺潇都分别扮演过不同版本的建宁公主。虽然金庸笔下的建宁公主,形象个性固定,情节也是固定的,但是不同版本的演足总杯对阵:切尔西落入附加赛,曼联遇上苦主,利物浦曼城很轻松
足总杯32强阶段的比赛全部结束,曼城、曼联和利物浦等英超豪门悉数过关,晋级下一轮。包括切尔西在内的10支球队,落入附加赛,需要通过重赛来决定晋级资格。 根据足总杯的规则,在32强的阶段,如果两支球队闯王起事时想尽办法毁了此风水宝地 原因很简单
风水之说,自古至今都有,现在也有很多人相信风水,这类的东西,相信的人就很信,不相信的人就觉得是无稽之谈,在古代人们都是非常相信风水之说的,因为那个时候和现在是完全不同的,百姓是非常迷信的,就拿下葬来说黑龙江空管分局技术保障部管制服务室阶段性完成设备隐患排查工作
按照民航局空管局年中工作会议精神,黑龙江空管分局技术保障部开展了一次设备隐患排查工作。管制服务室积极响应设备隐患排查要求,将科室所属15套设备按班组分工,排查责任落实到班组,精确到个人,全面开展玛雅金字塔之谜 它和亚特兰蒂斯城有什么联系
气势宏伟的埃及金字塔是人类古老文明的象征,然而建造金字塔所用的如此多的巨大石块,就算是用现代的设备来搬运也令人绞尽脑汁,而在缺少机械和科技的古埃及是怎样建成的呢?无独有偶,在南美洲的玛雅人和印加人也建阿迪达斯 Superstar 女生专属蛇纹鞋款系列开售,华丽野性范儿
潮牌汇 / 潮流资讯 / 阿迪达斯 Superstar 女生专属蛇纹鞋款系列开售,华丽野性范儿2020年02月17日浏览:3454 为迎接贝壳头诞生 50 周年,从去年华北空管局通信网络中心与民航数据通信有限公司开展技术交流
本网讯通讯员:刘津宇、范卫平)8月5日,华北空管局通信网络中心与民航数据通信有限公司开展技术交流,主要围绕数据公司开发空域规划设计软件进行交流。 空域规划设计软件结合空域规划多年经验基础开发,有助于揭秘:迷倒汉武帝的李夫人如何倾城倾国的?
汉武帝热衷求神访仙,又好女色。他听信方士的妄说,嫌旧宫矮小,不足以迎神,同时也想使后宫可以容纳天下更多的佳丽。于是在太初元年修了“建章宫”。建章宫周长三十里,里面可以容纳千门万户,内殿有十二个门,台阶