类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
35684
-
浏览
92232
-
获赞
4
热门推荐
-
亚瑟士 Gel Lyte V 鞋款全新橄榄绿配色上架发售
潮牌汇 / 潮流资讯 / 亚瑟士 Gel Lyte V 鞋款全新橄榄绿配色上架发售2020年02月21日浏览:3162 跑鞋品牌 ASICS旗下的复古跑鞋 Gel Ly古镇摄影采风,收获满满
为提高通迅员的摄影创作能力与技术水平。8月29日,航空物流服务分公司设备部的通讯员们参加了公司组织的外出采风活动。走进位于番禺的沙湾古镇区,可以清晰辨析古镇发展的历史脉络,现存的街巷错落纵横、宗祠古屋雪狼班组赴京与完美班组开展班组结对交流活动
2018年8月27日,为了响应公司对基层班组的最新要求,落实班组结对共发展,北京飞机维修工程有限公司天津分公司定检中队第一分队雪狼班组班组长带领雪狼班组代表一行六人来到北京飞机维修工程有限公司北京基地民航重庆空管分局气象台组织参加自动气象观测设备资质排查第一阶段考试
2018年8月17日,根据民航局空管局和西南空管局安排,民航重庆空管分局气象台配合综合业务部组织气象设备技术人员完成了西南空管局自动气象观测设备保障人员资质排查第一阶段考试。本次考试为全程90分钟的闭阿迪达斯 Superstar 女生专属蛇纹鞋款系列开售,华丽野性范儿
潮牌汇 / 潮流资讯 / 阿迪达斯 Superstar 女生专属蛇纹鞋款系列开售,华丽野性范儿2020年02月17日浏览:3454 为迎接贝壳头诞生 50 周年,从去年首都机场安保公司郭文菊:用心拉近距离 用“新”提供优质服务
郭文菊,今年32岁,在首都机场安保公司已经工作10年之久,工作中她善于思考、勤于总结、严格管理,注重工作细节,时刻保持吃苦耐劳、一丝不苟、积极进取的工作态度和工作精神,受到了各级多次赞扬。在安全检查与参观孙中山先生故居有感
2018年8月16日,参加了航空物流服务分公司党委组织的党性教育专题培训,即参观孙中山先生的故居。孙中山先生的故居坐落在孙文公园的一个不显眼的角落。它并没有我们没有想象的那么奢华,那么高贵,那么引人注史上窝囊皇帝之最:献上妻女无数讨好敌人求和
宋钦宗赵恒,是宋朝的第九个皇帝,也是北宋的末代皇帝。一般来说,皇子们都是争相抢夺登基的,但是他不一样。金军南下河北沦丧之后,徽宗为了自己不做亡国之君,便下令退位。让他的长子赵恒登基。但是赵恒知道了自己国足胜越南摆脱小组垫底尴尬 国际足联排名拿到10.35积分
国足胜越南摆脱小组垫底尴尬 国际足联排名拿到10.35积分_中国队www.ty42.com 日期:2021-10-08 22:01:00| 评论(已有305959条评论)历史上的大侠郭解其实是个阴狠手辣之人
郭解,有着汉朝第一大侠的称号,姓郭,名解(读“xiě”),字翁伯,现在的济源东南人,是“中国第一女神相”许负的外孙。他的父亲也是一个著名大侠,却因为行侠仗义的时候触犯法律,被汉武帝下令诛杀。图片来源于东航江苏公司党委领导赴泗阳县考察调研扶贫工作
进村入户 考察调研 扶贫攻坚 中国民用航空网讯:8月24日,东航江苏公司党委书记、副总经理田洪带队赴公司驻泗阳县扶贫点开展脱贫攻坚调研、推动落实帮宁波空管站举办职工厨艺培训
为倡导健康生活理念,提高职工厨艺技能,同时挑选厨艺优秀女职工参加华东空管局女职工厨艺大赛,8月28日,宁波空管站工会特举办职工厨艺培训,全站近30名员工参加了此活动。培训活动在古林职业高级中学烹饪实训第三季度耳机线上传统电商平台:量额双高增
第三季度中国耳机线上传统电商平台销量为2990万副,同比增长26.8%;销额为51.6亿元,同比增长20.8%。11月13号消息,洛图科技公布了2024年第三季度,中国耳机线上传统电商平台不含拼抖快等河北空管分局技术保障部积极备战电信人员执照注册考试
保障安全飞行是第一要素。为了保证航空公司每一个航班上人民群众和生命财产的安全,河北空管分局每一位无线电机务员都严格持证上岗。因此,执照是上岗的必要证件。2018年8月下旬,河北空管分局技术保障部认真组东汉时期的陈蕃愿扫除天下讲得是什么故事
陈蕃是东汉时期名臣,与刘淑、窦武一起被称之为“三君”。后来陈蕃以孝廉步入官途,一生为政清廉,关于陈蕃还有一个故事,那就是陈蕃愿扫除天下,那陈蕃愿扫除天下的故事究竟是什么呢?图片来源于网络陈蕃愿扫除天下