类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
5
-
浏览
7
-
获赞
34264
热门推荐
-
前曼城财务顾问:切尔西必须迅速通过卖人赚1亿镑,否则很危险
2月3日讯 受到财务公平规则的限制,今年英超冬窗较为平淡,尤其是此前几个转会期投入巨大的切尔西。前曼城财务顾问斯特凡-博尔森谈到蓝军时表示:“虽然切尔西使用了摊销的伎俩,但在我看来他们的麻烦迫在眉睫,李龙:堵住“骗保”,不能只棒打企业
广州花都佳恒板业公司连连出现为工伤员工换名就医的怪事,经本报报道后,是骗医保还是避免工伤索偿的猜测都有。前天,又有知情人士透露:多数工厂都没有给员工买社保,互换名字骗取保金,此手法已成业内“常态”。企给红十字会最后一次“自新”的机会
“郭美美”事件,使红十字会“被染上”似乎洗之不净的名誉污点。但即使公众对红十字会的信任永远无法修复,中国,还是需要下一个“红十字会”,一个真正可以被称为慈善机构的“红十字会”。当今之中国,不是频频爆出明朝的灭亡该由谁来背锅?究竟是因为天灾还是人祸?
每次说起明朝灭亡的真实原因的时候,总有一个非常让人同情的观点冒出来,那就是明朝在灭亡的时候,整个地球正处于小冰河时期,当时各地的天灾不断,所以也就有了明朝的灭亡是因为天灾的借口。但是这并不是明朝灭亡的被阿扎尔踢的球童:当时我以为是马塔干的,他们告诉我是阿扎尔
2月1日讯 近日切尔西功勋阿扎尔与当年被他踢的球童查理-摩根重聚,两人畅谈往事。查理-摩根说:“太疯狂了,当时我一直以为是胡安-马塔踢的我,回到更衣室我也是这么认为的,还一直在想这件事。然后我的同伴告历史上除了曹植能七步成诗之外,北宋宰相寇准竟三步成诗
曹植七步成诗的故事成为美谈,享誉千古。曹植是三国时期著名的诗人,他和曹丕都是曹操的儿子。曹操去世后,曹丕继承了曹魏势力,登基成为魏文帝。曹丕当了皇帝,自然对之前和他争夺继承人的曹植心怀记恨,所以有一次撞人又逃逸,且看100万如何摆平?
8月27日凌晨,长沙中南大学大三学生马某无证驾驶新购置的大众CC牌轿车撞飞了正在人行横道上行走的两名行人。撞人后,马某继续驾车闯红灯逆行逃逸。经过长沙警方捕截,马某已被控制。出人意料的是,马某不但没有哄抬房价最高罚三万,“逗你玩”?
住建部近日就《房地产开发企业资质管理规定(修订征求意见稿)》公开征求意见。征求意见稿规定,房地产开发企业如囤地、擅自变更容积率、捂盘惜售、哄抬房价,可视情节轻重作出降低资质等级或吊销资质证书处理,并可市场监管总局启动第十届“电梯安全宣传周”活动
中国消费者报讯根据2021年全国“质量月”活动安排,按照“安心乘梯守护行动”工作要求,9月13日至19日,市场监管总局启动第十届“电梯安全宣史玉柱“最贵微博”背后的市场监管难题
巨人网络董事长兼首席执行官史玉柱8月24日在其个人微博上发言,对中国人寿意图控股民生银行提出不同意见,认为一旦中国人寿的并购成真,失去民营机制的民生银行,将失去核心竞争力,告别高速成长。尽管这条微博不收“择校费”无异于“变相抢劫”
2011年北京市“幼升小”部分重点小学的择校费显示,家长要准备“打点”的择校费用多的竟高达25万元!据介绍,这其中包含了教委统一要求的数额最高3万)以及人情关系费、中介费等的总和。今年幼升小,广州的家黄金首次站上1700美元
海都网—海峡都市报讯国际大宗商品市场和亚太股市全线大跌,只有黄金受避险情绪推涨到了历史高点,昨日国际金价第一次突破了1700美元/盎司。受此影响,福州黄金首饰的报价也水涨船高,但是对于最近打算购买黄金Air Max 95“110”特殊配色鞋款释出,致敬伦敦街头文化
潮牌汇 / 潮流资讯 / Air Max 95“110”特殊配色鞋款释出,致敬伦敦街头文化2020年02月24日浏览:3086 Air Max 家族在伦敦甚至全英国都非增进“信任”方能缓解“血荒”
“血荒”不可怕,认识不到造成“血荒”的原因才真正可怕。只有千方百计拓宽社会信任的基础,“血荒”方有可能逐渐缓解。最近,北京又开始闹起“血荒”。因供血紧张,一些可以择期的手术相应被推迟。造成这次“血荒”部门打架因为面子还是利益?
N王石川日前,江苏省物价局联合卫生厅等部门启动医药卫生服务价格大检查,医院向手术病人收取乙肝、艾滋等检查费用是否违规引起争议。该省物价局认为医院收取这些检查费用是没有依据的,该省卫生厅却认定这个问题“