类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
5
-
浏览
558
-
获赞
4
热门推荐
-
壕!德转:纽卡新老板能买两千多个姆巴佩或哈兰德
壕!德转:纽卡新老板能买两千多个姆巴佩或哈兰德_英超www.ty42.com 日期:2021-10-09 11:01:00| 评论(已有306057条评论)安禄山在攻进长安城之后,为什么不一举消灭逃跑的李隆基?
天宝十四载十一月(755年12月),安禄山以清君侧为借口起兵叛乱,天宝十五载正月(756年)占领东都洛阳,僭越称帝,国号大燕,年号圣武。同年六月攻陷唐都长安, 进入安史之乱最高峰。李隆基在长安陷落前仓我从“中国听证帝”身上读出悲哀
他是普通市民,从事法律工作,常报名参加昆明听证会,被选中的几率高达90%以上。在昆明去年举行的100多场听证会中,他参加了70场,在短短不到2年的时间里,这位名叫刘爱国的律师一共参加了110场各种听证关注微博自杀的“维特效应”
一条微博加几张吃剩的药盒照片,引来数千网友的关注。23日晚10点半,加V认证的模特苏巍在微博上直播自杀场面。不到一个小时,被转发数千次。(京华时报10月24日)先不问这是场炒作还是苏姓模特的真情流露,中粮各上市公司2016年3月28日-4月1日收盘情况
中粮集团旗下各上市公司2016年3月28日-4月1日收盘情况如下:3月28日3月29日3月30日3月31日4月1日中粮控股香港)06062.252.272.352.392.37中国食品香港)05063另类校服并非另类教育
西安“绿领巾”事件刚刚过去,刺眼的“优秀生”校服又出现了。昨天下午“天佑中华A”的微博一经发布,就引来了诸多网民的关注。记者注意到,这种红色“优秀生”校服不仅颜色有别于普通的的水蓝色校服,而且在这种校没有了谏臣魏征的李世民,在晚年到底做了什么昏庸的事?
一提到古代的圣君,人们总是会想到唐太宗李世民。后世的皇帝也大都在向李世民学习,尤其是他的善于纳谏,他和魏征的故事更是成了君臣之交的一段佳话。可人非圣贤,孰能无过,李世民晚年做的一系列的事情,看完估计能“穿越女”成新闻折射出科学的乱象
据新华社消息,近日,一名自称为宋朝穿越的“李师师”,在河南开封“万元卖菊花”,以期求得穿越之术返回宋朝,并展示了娴熟的舞技,以示她不是本朝人.而将菊花标价一项,就证明其行为是一种商业行为,这样的事情虽全球市场聚焦:黄金三年来最差一周!美元强势,油价延续跌势
汇通财经APP讯——本周全球市场走势分化:黄金创下三年来最大周跌幅,受美元强势和美联储政策预期影响,现货金价跌至2550美元附近寻求支撑;外汇市场美元独领风骚,英镑和欧元大幅走低;原油延续跌势,布伦特明朝开国是共有几个公爵?为何只有徐达的爵位传至明亡?
农民出身的朱元璋经过几十年的奋斗,建立了大明王朝,其后还北伐驱逐了元朝势力。开国不久,朱元璋开始大封功臣,在洪武三年十一月(1371年初),朱元璋封了六位公爵,也即明朝开国六公爵。下面趣历史小编就为大警惕基层公权“私有化”
《中国青年报》10月26日以整版篇幅,披露了一名挂职中原某县县长助理的北大博士生的博士论文内容,颇为触目惊心,如:血缘与姻缘构筑“政治家族网”;一把手拥有生杀予夺的权威;晋升几乎是各级干部的唯一奋斗目小悦悦,我们心怀歉意送你走
前言:2011年10月21日零时32分,一颗小小的心脏停止了跳动,她就是连日来备受关注的小悦悦。小悦悦的离去,对于我们每一个有血有肉有情有义的公民来说,不能不为此感到痛心,这一天,所有有良知者的哀伤,球队陷入危机?克洛普怼记者:写你想写的,你低估了球迷的智慧
1月30日讯 利物浦主帅克洛普今天出席对阵切尔西的赛前新闻发布会,谈到了范迪克的未来。你宣布赛季末离任后,范迪克等人仅剩18个月合同,球队项目会不会短期内有危机?克洛普:“不,这完全正常。很明显,外界不想修铁路的骗子不是好厨子?
郭德纲有句来自网络段子的名言:不想当厨子的裁缝不是好司机。这话当然见仁见智,怎么理解都行,但有一个核心点,大概能得到广泛共识——概而言之就仨字“不靠谱”。而现实的残酷之一就在于,那些凝聚无数骨灰级网友选修课不是课,是生活
说起选修课,很多在国内上过大学的人都会觉得那就是拿学分的课程,除了少数感兴趣的学生之外,大部分都是把选修课当做可有可无的东西,拿到学分就是胜利。但这次开学,广东不少高校选修课有不少相当新潮另类:广州大