类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
773
-
浏览
787
-
获赞
45
热门推荐
-
没有落后的产业,只有落后的技术
在人类历史的长河中,科技进步始终是推动社会发展和变革的关键因素。从远古是时代的简单工具到现代的尖端技术,每一次重大的科技突破,都如同璀璨的星辰,照亮了人类前行的道路。在时代的浪潮中,人们常常会对产业有身居高位的东汉名臣刘宽为官多年颇受好评
刘宽是东汉的名臣,他不只是当时著名的朝臣,还是刘邦的后人,也算是汉室宗亲,他的父辈就身居高位,到他的时候更是担任过大将军、司徒、东海相等重要职位,他治理朝政宽厚仁慈,受到了无数百姓的爱戴。图片来源于网魏帝曹髦御驾亲征讨伐司马昭 为什么会兵败身亡
曹髦作为曹魏的帝王,御驾征讨臣子司马昭的府邸,为什么会兵败身亡呢?网络配图1.首要原因:两者实力悬殊司马家族通过高平陵政变、嘉平废帝,基本上掌控了曹魏的军权和政权,而魏帝曹髦已经做傀儡7年了,从未掌握阿克苏机场翼飞党支部以“党员带头、凝聚动力”开展专题活动月
中国民用航空网通讯员代彦林 冯丽梅讯:6月阿克苏机场翼飞党支部围绕提升服务质量、带好员工队伍等核心任务,结合支部特点,党员队伍现状,组织党员带头干,激发团队效能,提升业务能力。阿克苏机场翼飞党支部依托生产冒牌桂圆肉 浙江长兴捣毁一处制假售假“黑作坊”
中国消费者报杭州讯记者郑铁峰)近日,浙江省湖州市长兴县市场监管局煤山所执法人员在巡查中发现南京一家企业生产的“才顶”牌桂圆肉标注的生产许可证为“QS”开凌烟阁二十四功臣之一的侯君集为什么要谋反
这小白猿应该是评书里对隋唐英雄人物起外号时用的,每一个绰号都表示对本人的尊敬,是对所有英雄好汉做出贡献的褒奖。而小白猿这一称号,就是对侯君集身轻如燕的表扬,也就是说这侯君集还是一位神偷。图片来源于网络阿克苏机场开展旅客异常行为识别专项培训
中国民用航空网通讯员张凤讯:为提升服务质量,筑牢安全底线,有效提高安全工作的质量和效率。近日,阿克苏机场安全检查站组织开展了旅客异常行为识别专项培训。本次培训以图文并茂的方式开展,安检全员参与,教员对阿克苏机场机务工程部学习山东航空安全质量提示
中国民用航空网通讯员葛润辉讯:近年,山航飞机在外站航线维修及一般勤务工作发生了多起不安全事件,为防止类似事件的再次发生,山航对航线维修及一般勤务工作风险及预防措施进行汇总,编写质量提示进行提醒。近日,平分秋色!近一个月3次碰面,阿森纳、利物浦各取1胜1平1负
2月5日讯 英超第23轮,阿森纳3-1利物浦。近一个月3次碰面,阿森纳、利物浦各取1胜1平1负。12月24日,英超第18轮:利物浦1-1阿森纳1月8日,足总杯第3轮:阿森纳0-2利物浦2月5日,英超第张飞是怎么死的?他的儿子张苞为何没给他报仇
张飞(?-221年),字益德,幽州涿郡(今河北省保定市涿州市)人氏,三国时期蜀汉名将。刘备长坂坡败退,张飞仅率二十骑断后,据水断桥,曹军没人敢逼近;与诸葛亮、赵云扫荡西川时,于江州义释严颜;汉中之战时首都机场旅业公司航旅业务举办“立业杯”服务技能竞赛
通讯员张逸报道 为进一步全面落实首都机场集团公司《关于广泛开展职工劳动竞赛的通知》相关要求,进一步巩固“三基”工作成果,加强员工队伍建设、提升员工技能和服务中心工作的重要作用,黄山航空客货公司开展岗位技能比武活动
为提升员工的团队协作意识和安全意识,检验员工的业务技能和作业规范,6月17日,黄山航空客货公司开展岗位技能比武活动。 结合工作实际,特种车辆驾驶岗位进行皮带传送车定点停靠技能比试,装卸岗位进行人工拉施耐德电气:共建微网新业态,共赢绿色新质力
伴随全球能源结构的深刻变革,智慧、绿色、灵活的微电网技术正成为构建新型电力系统、推动能源转型的关键力量。11月14日,2024施耐德电气微电网主题沙龙在厦门成功举办。在活动现场,施耐德电气携手众多行业武则天的长子李弘不同的身份时期的介绍
太子李弘是唐高宗李治的第五个儿子,武则天的长子,也是高宗时期所立的第二位太子,后来薨逝于太子位,被追封为皇帝的太子。关于他是在于永徽三年时期出生于皇宫,在永徽六年时就被封为代王,一年之后被立为皇太子。深圳空管站团委开展团建手册宣贯及工作部署会
文/图 蔡菁菁/游嵘昕、江媛)为提高管理效率,提升团的组织力,民航局空管局团委近期印发了《民航空管系统共青团基层组织建设工作手册》以下简称《工作手册》),并计划举行四场宣贯会,帮助广大团干用好这本&l