科技创新！

类Sora模型到底懂不懂物理？字节完成系统性实验证明

2024-11-17 17:43:08 admin

Sora爆火以来，模明“视频生成模型到底懂不懂物理规律”受到热议，型到系统性实但业界一直未有研究证实。底懂近日，不懂字节跳动豆包大模型团队公布最新论文，物理完成研究历时8个月，字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论：视频生成模型可以记忆训练案例，验证但暂时还无法真正理解物理规律，模明做到“举一反三”。型到系统性实

图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究，不懂表示“结论不令人意外，物理完成但很高兴终于有人做了这个尝试！字节”

自OpenAI发布Sora模型以来，验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组，对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇，决定深入研究。

历时8个月，该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频，用于训练基于主流DiT架构的视频生成模型。然后，通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律，判断模型是否真正理解了物理规律，并具有“世界模型”的潜力。类Sora模型到底懂不懂物理？字节完成系统性实验证明

实验中设计的不同运动场景

豆包大模型团队的实验发现，即使遵循“Scaling Law”增大模型参数规模和数据量，模型依然无法抽象出一般物理规则，做到真正“理解”。

以最简单的匀速直线运动为例，当模型学习了不同速度下小球保持匀速直线运动的训练数据后，给定初始几帧，要求模型生成小球在训练集速度区间内匀速直线运动的视频，随着模型参数和训练数据量的增加，生成的视频逐渐更符合物理规律。

然而，当要求模型生成未曾见过的速度区间（即超出训练数据范围）的运动视频时，模型突然不再遵循物理规律，并且无论如何增加模型参数或训练数据，生成的结果都没有显著改进。这表明，视频生成模型无法真正理解物理规律，也无法将这些规律泛化应用到全新的场景中。

通过进一步的实验分析，研究团队得出结论，“生成新视频时，模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生，一旦遇到从未见过的场景，如不同大小、速度的物体相互作用，就会‘犯迷糊’，生成结果与物理规则不符。”

不过，研究中也有一个好消息：如果训练视频中所有概念和物体都是模型已熟悉的，此时加大训练视频的复杂度，比如组合增加物体间的物理交互，通过加大训练数据，模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。

据了解，本研究两位核心一作都非常年轻，一位是95后，一位是00后，在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣，在8个月的探索中，他们阅读了大量物理学研究文献，也尝试从游戏中获得研发灵感，历经多次失败后，最终一步步确定研究思路和实验方法。

友链

外链

https://es.pinterest.com/pin/887983251525924056

https://www.facebook.com/profile.php?id=61565699271427

https://www.facebook.com/profile.php?id=61567139704371

https://www.facebook.com/profile.php?id=61565483156640

https://www.facebook.com/profile.php?id=61564965394216

https://es.pinterest.com/pin/887983251527446477

https://www.facebook.com/profile.php?id=61565150973003

https://es.pinterest.com/pin/887983251526828499

https://www.facebook.com/profile.php?id=61564989517782

https://m.facebook.com/profile.php?id=61564891040423

互链

《激战2》重磅版本「午夜国王」全球同步开启!

完美世界sf背后的神秘力量：如何成为游戏界的黑马？

民权县“十五五”规划编制前期工作推进会召开

证监会再发声：为A股市场引入更多增量资金

原子之心收集魂灵视频攻略

Reno12实况照片首发适配小红书：可分享有生命力的照片

Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap

文章

3651
浏览

661
获赞

4144

赞一个、收藏了!

8126
55328

分享给朋友看看这篇文章

相关标签

热门推荐

远光智能U盾管家获麒麟软件适配认证
近日，远光软件自主研发的智能U盾管家完成了与麒麟软件有限公司银河麒麟嵌入式操作系统 V10基于瑞芯微 RK3588ARM64 架构）的兼容性测试认证，在通用兼容性、性能及可靠性方面表现良好。图1：远光


黑龙江伊春：消费教育走进商超
中国消费者报哈尔滨讯高鹏记者刘传江）为进一步维护消费者合法权益，提高消费者依法维权意识，11月10日，黑龙江省伊春市消协组织消费志愿者、社区居民走进新区悦鲜生生鲜超市，开展主题为“优化消费环境提振消


传闻：《无畏契约》将于7月26日登陆主机平台
根据知名爆料人eXtas1stv的消息称，《无畏契约》将于7月26日正式登陆主机平台，此前拳头游戏曾宣布过将把该作带到主机平台，并在6月份开启了封闭Beta测试。目前《无畏契约》已登陆PC，拳头游戏已


老年医学中心开展《死亡文化与生死教育》课程
5月24日，我院老年医学中心公共选修课程《死亡文化与生死教育》顺利结课，四川大学17个学院的50余名同学选修了该课程。死亡教育课程在国内尚属于一门新兴学科，其目的是通过正面的死亡教育，告诉学生每一个


女足新帅竞聘不只4人竞争仍有其他教练准备报名
女足新帅竞聘不只4人竞争仍有其他教练准备报名_中国女足www.ty42.com 日期:2021-10-12 16:01:00| 评论(已有306574条评论)

中国云南路建同昆明寻甸县举行项目对接座谈会
12月7日，太平洋建设副总裁、中国云南路建总裁王然，引江建设CEO姜伟盛一行由寻甸县投促局副局长王顺萍全程陪同，分别与县发改委、交通局、城管局负责人举行项目对接座谈会，就进一步落实“12.1”会


队史首次！皇马凭借补时阶段的进球赢得同巴萨的国家德比战
10月29日讯此前结束的西甲比赛，贝林厄姆梅开二度，皇马客场2-1战胜巴萨。根据统计，这是皇马队史第一次凭借在补时阶段的一粒进球赢得了同巴萨的国家德比战。标签：

雄安首个“光伏+临建”试点项目单月电费节省26%
入夏以来，雄安新区气温节节攀升，又到一年一度的用电高峰期。然而，雄忻高铁雄安地下段7标项目部的电费支出与去年同期相比却在逐天下降。中铁建设集团项目经理王强算了一笔账，项目部临建引入分布式光伏后，单月电


阿迪达斯 Superstar 女生专属蛇纹鞋款系列开售，华丽野性范儿
潮牌汇 / 潮流资讯 / 阿迪达斯 Superstar 女生专属蛇纹鞋款系列开售，华丽野性范儿2020年02月17日浏览：3454 为迎接贝壳头诞生 50 周年，从去年


萨拉赫生涯第5次入围金球前30，但今年第11是5次中最差
10月31日讯官方宣布，萨拉赫今年的金球奖排名第11。今年是萨拉赫生涯第5次入围金球奖前30大名单，不过今年的排名第11是最低的一次。2018年：第62019年：第52021年：第72022年：第5

欧盟准备对中国进口生物柴油征收关税
欧盟(EU)发现中国生物柴油在欧盟市场以低价销售，计划将对中国生物柴油征收临时关税。据路透社报道，负责欧盟贸易政策的欧盟委员会提议设定12.8%至36.4%的临时关税。调查将持续到明年2月，届时可能确


联赛杯16强利物浦作客伯恩茅斯，埃利奥特、若塔应有好表现！
今晚凌晨联赛杯16强利物浦作客同属英超的伯恩茅斯，16强中有10支英超球队全部今晚列阵，其中四场由英超对垒，换句话说成功入到8强最多只有6队英超，如果抽签顺利下一轮遇上较低级别对手，杀入四强就机会极大


绮籽品牌简介(绮籽女装官网)
绮籽品牌简介(绮籽女装官网)来源：时尚服装网阅读：5808绮籽的读音拼音：qǐ 简体部首：纟五笔：XDSK总笔画：11笔顺编码：フフ一一ノ丶一，フ一，解释：有文彩的丝织品：～罗。纨～。～襦纨绔。绮籽


国家电投发行碳中和绿色类REITs
7月18日，国家电投在上交所发行“国家电投-江西公司能源基础设施投资碳中和绿色资产支持专项计划(类REITs)”，发行规模17.04亿元，并以2.28%的发行成本再次刷新全国类


折叠屏市场百花齐放，横向大折叠和竖向小折叠谁才是你的菜？
随着时间来到24年下半年，广大考生们的学业可以告一段落，各家数码厂商也紧锣密鼓地推出了自己的新一代产品，整个7月已经被各家大大小小的发布会承包。除了传统直板手机之外，荣耀和小米