类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
3787
-
浏览
88767
-
获赞
34
热门推荐
-
BEAMS x Columbia 联名 90s 军事风系列公布,6 种款式
潮牌汇 / 潮流资讯 / BEAMS x Columbia 联名 90s 军事风系列公布,6 种款式2020年02月26日浏览:3094 此前携手始祖鸟等多品牌进行合作又一个大佬出走,Intel CEO 宣布退出总统制造业委员会
雷锋网讯:继钢铁侠埃隆马斯克出走后,又一个科技大佬宣布退出总统制造业委员会。这次出走的是Intel的CEO科再奇,同时辞职的还有默克制药又称默沙东)首席执行官肯尼斯·弗拉奇尔、运动品牌安德玛Under凤岗龙城时尚服装店在哪里,龙凤城服饰织造有限公司
凤岗龙城时尚服装店在哪里,龙凤城服饰织造有限公司来源:时尚服装网阅读:528深圳ef女装店铺有哪几个深圳宝安机场品牌女装店有:TORYBURCH女装服装店(地址:深圳宝安国际机场T3航站楼)。Aone梅西亮相奥斯卡颁奖礼,网友:请给它最佳抢镜奖
据媒体报道,在第96届奥斯卡提名午宴上抢光所有人风头的明星狗“梅西”Messi),因被众多电影公司集体投诉涉嫌在投票窗口期不正当竞争,此前被禁止参加奥斯卡颁奖典礼。然而在今11中粮茶业拓展东南亚市场 普洱新品马来西亚首发
近日,中粮茶业云南公司举办的“中茶普洱 王者归来 茶美生活 情牵大马” 臻品蓝印大型主题发布品鉴会马来西亚站)在马来西亚首都吉隆坡举行。中粮茶业云南公司总经理邹广田表示,中粮茶随着中东风险飙升,交易员更加看好石油
汇通财经APP讯——随着中东紧张局势加剧,对冲基金和其他投资组合经理开始在本月初的油价交易中计入更高的风险溢价。在上周末伊朗无人机袭击以色列之前的几周,基金经理大幅增加了原油和其他主要石油产品合约的多《怪物猎人:崛起》天廻龙的重壳怎么获得
《怪物猎人:崛起》天廻龙的重壳怎么获得36qq8个月前 (08-13)游戏知识185小心这些打着“国家政策”“国家项目”牌的虚假APP
近日,工信部反诈专班公布了一批涉诈高风险APP,一些不法分子套用各类官方公开信息,打着“国家支持项目”“国家惠民政策”旗号,制作出一大批涉诈APP,在其卡哇伊新战靴 New Balance Kawhi 首次曝光,手掌纹理抢镜
潮牌汇 / 潮流资讯 / 卡哇伊新战靴 New Balance Kawhi 首次曝光,手掌纹理抢镜2020年02月17日浏览:4453 卡哇伊刚刚拿到了全明星“Kobe苏商集团董事局副主席赴内蒙呼伦贝尔市考察
7月22日,苏商集团董事局副主席赵琦一行赴内蒙古自治区呼伦贝尔市考察,呼伦贝尔市发改委主任郭平予以接待,双方就基础设施项目建设展开深入会谈。 会谈中,双方共同观看了苏商集团宣传片,赵琦详细介绍了苏商雷恩全部赛程,2022
雷恩全部赛程,2022-2023赛季法甲联赛雷恩最新赛程2022-08-08 16:40:14目前,新赛季英超、法甲以及法甲首轮比赛已经拉开序幕,首轮对决正火热进行中,2022-2023赛季法甲联赛在中国茶叶为湖北贫困村开展标准茶园创建规范与技术专题培训
5月14日,中国茶叶为湖北丹江口市大沟林区瓦房槽村开展标准茶园创建规范与技术专题培训。 此次培训面向瓦房槽村30余名茶叶种植户,由中国茶叶内部专家、福建茶叶公司总经理助理叶红通过视频连线的方远光智能U盾管家获麒麟软件适配认证
近日,远光软件自主研发的智能U盾管家完成了与麒麟软件有限公司银河麒麟嵌入式操作系统 V10基于瑞芯微 RK3588ARM64 架构)的兼容性测试认证,在通用兼容性、性能及可靠性方面表现良好。图1:远光母亲:C罗的身体状态非常出色 他还能再踢三年
母亲:C罗的身体状态非常出色 他还能再踢三年_多洛雷斯www.ty42.com 日期:2021-06-18 09:01:00| 评论(已有284428条评论)洛克王国乖乖组宠物:挑战最萌搭档!
洛克王国乖乖组宠物有:地鼠、迷你利乌、电狐、灵狐和五毒兽。洛克王国乖乖组宠物:挑战最萌搭档!想象一下,一个由各种神奇动物组成的王国,那就是洛克王国。在这个充满魔法的世界里,每个宠物都有独特的技能和属性