类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
942
-
浏览
2
-
获赞
65933
热门推荐
-
新百伦 x Aimé Leon Dore 全新联名 827 鞋款释出
潮牌汇 / 潮流资讯 / 新百伦 x Aimé Leon Dore 全新联名 827 鞋款释出2020年02月27日浏览:2925 不久前,纽约街牌Aimé LeonAMD Zen 5移动处理器预计8月发 迷你主机10月用上
消息称AMD用于移动平台的下一代Strix Point系列移动处理器有望在8月份正式发布。此前AMD已经多次确认将会在年内发布全新的Zen 5架构处理器,但此前的消息更多是针对桌面处理器的,移动处理器江西坠河失联女老师遗体被发现,多方证实
连日来,江西崇仁二中一名年轻女老师坠河失联的消息在网上流传开来,引发广泛关注,其下落、安危也牵动众人心。5月18日,不幸的消息传来,该女老师已找到,遗体在水中被发现,令人痛心!此前网传消息显示,5月1Microsoft Start Networks 中国内容生态伙伴峰会成功举办
2024 年 5 月 22 日,苏州——微软 Microsoft Start Networks 中国内容生态伙伴峰会Microsoft Start Partner Summit)在微软苏州新园区成功举gxg为什么贵(gxg这么贵)
gxg为什么贵(gxg这么贵)来源:时尚服装网阅读:16962GxG衣服牌子怎么样,买了一件一千多贵吗GXG衣服说实话料子一般,就是板型超帅,同档次服装品牌里应该数GXG做修身正装最为不错。这个品牌属你可能不是懒,而是太累了
明明睡了一下午,起来却觉得浑身不对劲,甚至怅然若失。明明狂玩手机,却觉得越玩越累。“我怎么就歇不好呢?”其实,你可能没找到适合自己的休息方式:对于i人来说,社交、派对只会更消耗湖北一警车高速逼停小车被指报复性执法,当地:两民警已停职
5月13日,有网友发布高速上一辆警车截停一私家车的视频引发众多关注,警车的行为被质疑存在报复性执法。潇湘晨报此前报道,14日下午,记者经与湖北高速交警三支队和荆州市松滋市公安局核实,确认该警车属于荆州印度降手机零件税率 咖喱味iPhone要攻占全球
印度方面将用于手机制造的塑料、金属机械零件、SIM 卡插槽和螺丝等零部件的关税,从15%下调至10%。希望能够提高印度生产的苹果手机占比。分析师郭明錤早先曾经表示,2023年印度生产的iPhone手机maxmara六大经典款(maxmara六大经典款大衣介绍)
maxmara六大经典款(maxmara六大经典款大衣介绍)来源:时尚服装网阅读:6853maxmara是什么品牌?这款版型的大衣真绝了1、MaxMara是一个意大利品牌,始于1951年,创办人Ach马建平会见美国农场局联盟主席
8月23日,集团副总裁马建平在中粮福临门大厦会见了美国农场局联盟主席Bob Stallman一行,双方就中美农产品贸易、合作机会等广泛交流了意见。马建平介绍了中国大豆、小麦、玉米、大米等粮食作物供求情江西发布2021年双11消费提示
中国消费者报南昌讯记者朱海)一年一度的双11已经拉开序幕,为保障广大消费者合法权益,确保消费安全,11月4日,江西省市场监管局、江西省消保委联合发布消费提示,提醒广大消费者保持理性、警惕陷阱、收货细验旅客奶粉罐藏13件象牙饰品被查:总重268.18克
近日,杭州萧山机场海关关员对入境航班进行监管时,通过先期机检锁定一件异常行李,随后在“无申报通道”将携带该行李通关的旅客精准拦截。经现场进一步查验,海关关员在其行李箱内发现2个中粮集团与中检集团签署战略合作备忘录
9月22日,中粮集团与中国检验认证集团签署战略合作备忘录。集团副总裁万早田和中检集团董事长齐京安出席签字仪式。根据该合作备忘录,双方将在质量设计控制、种植养殖、食品加工制造、贸易物流等食品安全领域和安2023年五大联赛射手榜:拉卡泽特、奥斯梅恩、哈兰德居首
2023年五大联赛射手榜:拉卡泽特、奥斯梅恩、哈兰德居首2023-05-12 15:16:28北京时间5月12日,2022-2023赛季欧洲五大联赛正在如火如荼的进行之中,2023年已经进入五月份,目中学时期DIY马拉多纳人偶
更多自传内容请点击图片) 往年9月,博格坎普在阿姆斯特丹的一家咖啡厅举办宣布会,浩荡推出自传《运动与速度》。克鲁伊夫受邀列席,从博格坎普手里接过了编号14的特殊版本。11月13日报道:如今,博格坎普童