类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
38
-
浏览
2451
-
获赞
3
热门推荐
-
AMBUSH 2020 新款 Logo 折叠短梳亮相,风格型男必备
潮牌汇 / 潮流资讯 / AMBUSH 2020 新款 Logo 折叠短梳亮相,风格型男必备2020年02月20日浏览:2572 此前美乐淘潮牌汇为大家带来了 AMBU茶叶可以归纳为哪六大类?在制作工艺上有什么区别?
根据各种茶制近中茶多酚的氧化聚合程度由浅入深而将各种茶叶归纳为六大类,即是绿茶、黄茶、白茶、青茶、黑茶和红茶。下面趣历史小编就为大家带来详细的介绍,一起来看看吧!1、绿茶:属于不发酵茶,在绿茶的制作过避孕套用法入考题,如此创新“少少益善”
“避孕套有哪些用法?”26日,微博认证为“福建师范大学传播学院教师”的网友“@卢佳音”晒了一张期末试卷,卷子的第二题居然是“说出避孕套的用法”。记者了解到,试卷出自该学院“策划与创意”课老师黄果之手,名校校花惹争议暴露出的国人心态
6月13日,有网友爆料北大校花袁佳怡哈佛和北大学历造假,她的私生活也被“呛声”为不检点。此前,网络上流传着两张关于清华校花章泽天和北大校花袁佳宜的“女神对比照”,引发网友热议。6月13日人民网)得众人lowa中国官方网站(lowa品牌介绍)
lowa中国官方网站(lowa品牌介绍)来源:时尚服装网阅读:7744lowa中文译音是什么lowa 释义:洛瓦中文译音)双语例句:C:I would like to make a reservati肇事司机责任倒查究竟该查谁?
交通运输部日前印发《“机动车驾驶培训教练员素质提升工程”实施方案》,要求通过严格教练员资格管理、强化教练员监管与责任追究、开展教练员全员培训和技能评比等方式,开展“机动车驾驶培训教练员素质提升工程”。15岁初中生有编制让求职者情何以堪
“15岁的小孩,初中还没毕业就已经有编制、拿工资了!”河南叶县水利局下属河道管理所所长利用职务之便,早早为还在上学的儿子捧起了“铁饭碗”,每月1000多元的工资,现在已经领了6年。据统计,该单位69名网民为何不信“房爷”是清白的
当初赵海滨“有192套房”的新闻刚刚曝出时,举国震惊。如今,赵海滨居然平安回归了,除了被开除公职之外,没有受到任何处罚,这听上去同样匪夷所思。当陆丰“房爷”赵海滨平安结束双规,举报者黄坤意却因涉嫌参与曝巴萨债务已减少28.4% 仍有1.15亿欧转会费待付
曝巴萨债务已减少28.4% 仍有1.15亿欧转会费待付_欧元www.ty42.com 日期:2021-10-05 09:31:00| 评论(已有305427条评论)金明岩:化解打车难问题须降低公司成本
要求解打车难问题,化解涨价的烦忧,恐怕还不能简单地在消费者和司机之间实现财富转移,还必须有公司这一方的降低成本。每公里调到2.3元还是调到2.6元,这看似简单的选择题在此次出租车调价听证会上却显得并不“最美太空教师”与观众相约“太空课堂”
六月十日,天宫一号与神舟十号载人飞行任务航天员在酒泉卫星发射中心同记者见面。即将执行神舟十号载人飞行任务的航天员聂海胜、张晓光和王亚平首度亮相并回答了记者的提问。(6月10日新华社)10日下午在酒泉卫欧阳修为何要弹劾战功卓著的狄青?欧阳修其实是在帮狄青
宋朝一直秉承重文轻武之原则,武将难以得到重用,朝堂之上,文臣地位较为突出。尽管如此,宋朝依旧出现过两位青史留名的将领,北宋的狄青和南宋的岳飞。岳飞不必多言,称得上家喻户晓,率领岳家军征战沙场,抛头颅洒索帅看到了吗?桑乔单场两助攻正名 三狮生涯首次
索帅看到了吗?桑乔单场两助攻正名 三狮生涯首次_英格兰队www.ty42.com 日期:2021-10-10 08:31:00| 评论(已有306171条评论)始终把人民生命安全放在首位
生命最宝贵,安全大过天。保障生命安全是人民幸福的基本要求,是改革发展稳定的基本前提。近期发生的多起重特大安全生产事故,令人痛惜,催人警醒:要始终把人民生命安全放在首位,坚守这条不可逾越的红线,以人为本在古代究竟怎么样才能战胜骑兵?大体有哪三种方式?
骑兵因为机动性强,拥有强大的突袭能力,所以同样数量的步兵往往难以抵挡骑兵的冲锋。所以,战争骑兵的最有效方法无疑是用骑兵对抗骑兵。我国历史上最著名的战例就是汉朝反击匈奴和唐朝反击突厥。但是,由于中原王朝