类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
211
-
浏览
33
-
获赞
7676
热门推荐
-
市场监管总局启动第十届“电梯安全宣传周”活动
中国消费者报讯根据2021年全国“质量月”活动安排,按照“安心乘梯守护行动”工作要求,9月13日至19日,市场监管总局启动第十届“电梯安全宣在白垩纪时期,当时的生物都是因为什么而灭绝的?
剧烈的地壳运动和海陆变迁,导致了白垩纪生物界的巨大变化,中生代许多盛行和占优势的门类(如裸子植物、爬行动物、菊石和箭石等)后期相继衰落和绝灭,新兴的被子植物、鸟类、哺乳动物及腹足类、双壳类等都有所发展巨大的压力会导致白发,科学家是怎样找到了初步的答案?
对于这些现象,或许您已经见怪不怪了:一些学生随着高考的临近,逐渐长出了白发;一些国家领导人在正式就任之前头发是乌黑的,然而就任后短短几年内,他们就满头白发。大多数人都知道巨大的压力会导致白发。但是对于为何说陈霸先的一生,就如同他名字一般霸气凛然?
陈霸先的一生,就如同他名字一般霸气凛然。这个穷苦人家的孩子,一路靠着贵人相助和自己玩命,成功登上南朝的权利巅峰。然而天道好轮回,报复不缺席....下面趣历史小编就为大家带来详细的介绍,一起来看看吧!南分析师:黄金中期上涨趋势已被破坏,需要时间重燃涨势
汇通财经APP讯——黄金今年表现出色,创下每盎司2790美元的历史新高,从2月份的低点上涨了40%以上,但一位分析师表示,中期上涨趋势已被破坏,宏观经济因素可能需要一段时间才能重新点燃黄金的涨势。OA天华院参研重大装备国产化项目通过验收
近日,由天华院和中国石化镇海炼化分公司共同承担的“聚丙烯催化剂加入系统研制”、“聚丙烯动力分离器研制”两个重大装备国产化项目成功通过验收。国产化的聚丙烯催化剂加入系统催化剂预接触罐及搅拌器)是天华院创关羽和张飞骁勇善战,刘备为何不让他们帮自己夺取益州?
公元211年,曹操决定攻打汉中,消息传到益州后,益州牧刘璋非常担心,他害怕曹操攻克汉中后要对自己动手,为了抢先一步占据汉中,抵御曹操,刘璋在张松的建议下,派出法正邀请刘备入川,帮助自己对付张鲁。当时法良妃与令妃的出身都差不多,为何只有嘉庆最终成了皇帝?
1795年农历九月初三,正是乾隆登基六十周年的日子,也就是在这一天,乾隆将公布皇储究竟是谁。话说,自雍正创立秘密立储制度后,储君是谁,就成了天下最大的秘密。早在1773年,乾隆就将立储诏书藏于乾清宫的中粮各上市公司2015年11月9日-11月13日收盘情况
中粮集团旗下各上市公司2015年11月9日-11月13日收盘情况如下:11月9日11月10日11月11日11月12日11月13日中粮控股香港)06063.193.083.033.152.95中国食品香如果谢道韫当时不嫁给王凝之,她的生活是否会过得很幸福?
男怕入错行,女怕嫁错郎,不论是现代还是古代,这句话都堪称真理,一点毛病都没有。没有哪个女人不想嫁给值得托付终身的男子,奈何人心难测,尤其古代的女子,几乎不可能自由恋爱,婚姻大事全由父母做主,即使嫁给渣“超级月亮”在现代人看来,它的产生有哪两个关键点?
月亮到地球的平均距离约是38万千米,但月亮绕地球运行的轨道并不是圆形的,而是椭圆形的。据测量,月球位于近地点时,距离地球的平均距离为36.3万千米,而位于远地点时,平均距离为40.6万千米,两者相差达服装配搭时尚语录(服装搭配配文)
服装配搭时尚语录服装搭配配文)来源:时尚服装网阅读:165关于服装时尚的句子1、服装和举止不能造就一个人,但他被造就成人时,服装和举止就会极大地改善他的外貌。每一个人都嘲笑陈旧的时尚,却虔诚地追求新的生产冒牌桂圆肉 浙江长兴捣毁一处制假售假“黑作坊”
中国消费者报杭州讯记者郑铁峰)近日,浙江省湖州市长兴县市场监管局煤山所执法人员在巡查中发现南京一家企业生产的“才顶”牌桂圆肉标注的生产许可证为“QS”开三国时期的君主,其实手里都有怎样属于自己的特种部队?
三国时期的君主,其实手里都有一支属于自己的特种部队,比如说刘备的白眊兵、无当飞军,孙权的锦帆营、解烦兵,当然还有曹操的虎豹骑。下面趣历史小编就为大家带来详细的介绍,一起来看看吧!身处乱世,如果手底下没吴三桂作为三藩之乱的老大,三藩之乱为何却没有成功?
说起吴三桂,陈圆圆是必须要提。而讲到康熙,必然要提到吴三桂。当时在我记忆中吴三桂陈圆圆那真的是美女配英雄,天造地设呀。而这中间因为他们还发生过很多的大事,当然在这里小编就不再一一讲述了。趣历史还是来讲