类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
754
-
浏览
69686
-
获赞
29
热门推荐
-
msmin全国实体店(miumiu中国官网旗舰店)
msmin全国实体店(miumiu中国官网旗舰店)来源:时尚服装网阅读:3509有哪些适合二十多岁女生的服装品牌?我个人推荐迪赛尼斯,每件衣服都很有让你买的欲望,真的很好看,而且很适合出去穿。 国产女聚焦双11•购物更有谱
中国消费者报郑州讯记者耿记安)“双11”购物狂欢节拉开序幕,各大电商平台和线下商场纷纷加大促销力度,吸引消费者购物。为提振广大消费者的消费信心,营造安全放心的消费市场环境,加强对社区居民消费者普法宣传既然吴军已经占领了楚国都城,为何却草草收兵回吴国?
春秋后期,楚平王给儿子太子建征婚,派宠臣费无忌向秦国请求联姻。秦楚两强联姻不是第一次,秦哀公答应了,派出女儿孟嬴。费无忌因与太子建不睦,见孟嬴漂亮,建议楚平王自己娶。楚平王居然答应了。真是一个敢说一个北京472家医疗机构创建为老年友善医疗机构
【资料图】6月29日,北京市老龄办、市老龄协会发布《2022年北京市老龄事业发展概况》以下简称《概况》)。概况显示,2022年,北京市继续开展老年友善医疗机构建设,共有472家医疗机构创建为老年友善医国足胜越南摆脱小组垫底尴尬 国际足联排名拿到10.35积分
国足胜越南摆脱小组垫底尴尬 国际足联排名拿到10.35积分_中国队www.ty42.com 日期:2021-10-08 22:01:00| 评论(已有305959条评论)南宋诗人陆游晚年长期闲居在家时,他如何对猫起了兴趣?
说起陆游老先生,我们的印象一般是这样的:爱国标兵。整日介想着收复中原。勤奋小达人。一辈子写了上万首诗。催泪扛把子。一曲《钗头凤》,哭煞无数人。然而,你以为故事就到此为止了嘛?才不是嘞!陆老先生的正确打提起“环肥燕瘦”,汉成帝如何遂了自己终老温柔乡的梦想?
“环肥燕瘦”释义环是指的唐玄宗贵妃杨玉环,燕是指的汉成帝皇后赵飞燕。“环肥”说的是杨玉环的美丽与丰满,“燕瘦”表现的则是赵飞燕的苗条与柔弱。虽然飞燕未被列入古代四大美女的行列,但却不见得比杨玉环的姿色薄荷叶真有这么大的魅力吗?唐朝为何如此爱嚼薄荷叶?
薄荷是我国几千年前,就有的本土植物。大家想必都吃过薄荷糖,所用的牙膏,及其他一些清凉解毒之物品,都有薄荷的成分。可是千年之前的唐代,好像不少人都喜欢嚼薄荷叶?前段时间,有部非常著名的唐代古装剧,里面的武磊赛后称绝杀球自己没碰到 裁判依然将其算在武磊账下
武磊赛后称绝杀球自己没碰到 裁判依然将其算在武磊账下_越南队www.ty42.com 日期:2021-10-08 03:31:00| 评论(已有305791条评论)在关于苏秦和张仪的记载里面,他们究竟是同一时期的人吗?
在史记以及其他很多关于苏秦和张仪的记载里面,都是说苏秦比张仪先出师,在赵国谋事。而张仪在苏秦的侮辱之后才去的秦国,后来成为秦国的相国。可是根据他们的出生时间以及后来的历史的记述,苏秦可是在张仪死后才正既然吴军已经占领了楚国都城,为何却草草收兵回吴国?
春秋后期,楚平王给儿子太子建征婚,派宠臣费无忌向秦国请求联姻。秦楚两强联姻不是第一次,秦哀公答应了,派出女儿孟嬴。费无忌因与太子建不睦,见孟嬴漂亮,建议楚平王自己娶。楚平王居然答应了。真是一个敢说一个从某种意义上来讲,魏国为何是三国中最先亡国的?
对于这样一个题目,可能有不少人会提出疑问:在历史上,蜀国亡于263年,魏国亡于265年,吴国亡于280年,三国中最先亡国的应该是蜀国,不应该是魏国,是不是搞错了?其实,魏国在司马师、司马昭兄弟轮番辅政类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,“视频生成模型到底懂不懂物理规律”受到热议,但业界一直未有研究证实。近日,字节跳动豆包大模型团队公布最新论文,研究历时8个月,围绕“视频生成模型距离世界模型有多远”首次在业界完成系统明朝必须迁都到北京后,才能守住北部的半壁江山吗?
明朝的大神王阳明曾经对明朝的国防提出了自己的战略构想,他的观点是“大明虽大,最为紧要之地四处(宣大蓟辽)而已。若此四地失守,大明必亡”。他所说的这些地方位于山西北部、河北北部和辽东地区,换句话说,也就在春秋战国时期,中国第一个盐商是鲁国的哪位商人?
秦汉时河东郡地在今山西运城、临汾一带。因黄河流经山西省西南境,山西却在黄河以东,故这块地方古代称为河东。古人从河东盐池中引水至旁边的耕地,每当仲夏时节,遇到刮大南风时,一天一夜耕地中就长满了盐花,当地