类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
24384
-
浏览
117
-
获赞
5
热门推荐
-
球队陷入危机?克洛普怼记者:写你想写的,你低估了球迷的智慧
1月30日讯 利物浦主帅克洛普今天出席对阵切尔西的赛前新闻发布会,谈到了范迪克的未来。你宣布赛季末离任后,范迪克等人仅剩18个月合同,球队项目会不会短期内有危机?克洛普:“不,这完全正常。很明显,外界慈禧究竟有何倾世之貌:为什么越老越风骚
慈禧太后作为大清王朝的“无冕女皇”,不仅垂帘听政干预朝政,私生活也荒淫无比,越老越淫荡,67岁了还与29岁的英国情人风流快活!对于史上这样位具有影响力的女统治者,至今众人对其风流韵事都非常感兴趣,更是第十四架接返自乌克兰撤离中国公民临时航班安全抵达杭州
据外交部领事保护中心官方微博消息,3月15日上午10时24分,第十四架接返自乌克兰撤离中国公民临时航班安全抵达杭州。历史上袁绍为什么要杀忠心耿耿的谋臣田丰?
田丰死得很冤枉。他死不是因为做错了什么,而是因为做事情太耿直了。田丰是袁绍的谋士,屡次为袁绍出征出谋划策,为主公消灭敌人立下大功。当将军想要出征讨伐曹孟德的时候,田丰持反对意见。理由很充分,天下局势已瑜之美运动用品有限公司(瑜美国际简介)
瑜之美运动用品有限公司(瑜美国际简介)来源:时尚服装网阅读:1694iFresh博览亚果会38毫米差不多相当于一个砂糖橘的直径,山竹也差不多.38mm便是8厘米。毫米millimeter),又称公厘或云南空管分局技术保障部派员参加西南空管局通导工作会
3月4日,西南空管局组织召开2022年通信导航监视工作会,西南空管局副局长何天剑、西南空管局副局长陈甫、西南空管局总工程师林涛、西南空管局通导部部长李晓翼,云南空管分局副局长孙剑、各部门主要领导,运行广西空管分局举办“青年课堂”气象预报培训班
中国民用航空网通讯员李叶、刘远方、曾翔宇报道)为进一步推进气象专业岗位融合建设,统筹做好岗前培训工作,3月9日,广西空管分局气象台举办“青年课堂”气象预报培训班。 课秦始皇陵阴兵借道:秦始皇竟然是地府鬼王
秦始皇举全国之力,为自己建造陵墓,盛况空前,秦始皇陵里到底都埋藏着些什么?有传言称,秦始皇生前是百鬼之王,所以才会统一六国,这到底是真是假?而秦始皇陵附近阴兵借道的传说,又是怎么回事?网络配图生前居国足胜越南摆脱小组垫底尴尬 国际足联排名拿到10.35积分
国足胜越南摆脱小组垫底尴尬 国际足联排名拿到10.35积分_中国队www.ty42.com 日期:2021-10-08 22:01:00| 评论(已有305959条评论)铸剑业的始祖欧冶子这个人史上真的存在吗?
欧冶子是中国春秋战国时期的传奇人物,他活跃的年代大概是在公元前514年,那是正是春秋时期的末期,战国时期正要到来。欧冶子是中国铸剑业的始祖,他有一手十分神奇的逐渐手艺,他所铸造的剑都是那些传说中无坚不野史趣闻:慈禧太后为什么三十晚上包饺子?
三十晚上北方人不吃饺子,会觉得没有过年的气氛。正如现在的中国人,大多要看春节联欢晚会。谚语:“三十晚上吃饺子——没有外人。”以示亲密无间。可见饺子当年是除夕之夜各家各户庆团圆的必备之物。北方人吃水饺,西汉时期官员西汉灌夫是一个爱发酒疯的人?
灌夫,字仲孺。是西汉时期官员,本应该是姓张,但由于父亲张孟曾是颍阴侯灌婴家臣,所以赐姓为灌。灌夫为人刚强直爽,好发酒疯,不喜欢当面奉承人。图片来源于网络在吴楚七国之乱之时,灌夫曾一人率领一千人跟随父亲优衣库 UT 全新 THE BRANDS MASTER PIECE 系列首波单品公布
潮牌汇 / 潮流资讯 / 优衣库 UT 全新 THE BRANDS MASTER PIECE 系列首波单品公布2020年02月20日浏览:3558 每一季 UNIQLO开创新型服务模式 推进企业深化改革
通讯员:赵凯、刘采霞)为贯彻落实《中南空管局所属企业改革三年行动方案2020-2022)》,3月2日,桂林空管站召开公司整合推进会议,部署整合后桂林民航航空服务有限公司的近阶段工作,着手推进相关工作的乌鲁木齐国际机场分公司安全检查总站组织开展“四小”活动
(通讯员 张顺龙)为进一步提高“三基”建设水平,深入推进班组建设,突出培训在保障安全生产和服务质量中的重要作用,切实激发员工工作积极性,近日,乌鲁木齐国际机场分公司安全检查总站