人生箴言
成熟意味着停止展示自己并隐藏自己
随机文章
- 时速200公里/时 美国新高铁全线通车首日就晚点:撞上1名行人致死亡 !
- 豪华感拉满!问界M9内饰、底盘曝光:全铝合金就是豪横 !
- 藏毒车被盗毒贩去报案当场被抓!网友:自己“送货上门” ?
- 袁记云饺回应被指是预制菜:我们都是新鲜的 明厨亮灶有目共睹 !
- 1年电池耗掉20%!iPhone 14/13等大批用户吐槽苹果:换电池也涨价 !
- 梁静茹承认演唱会翻车:现在心情很想跳河,下次会更好 !
- 不止Mate 60!华为秋季新品发布会官方剧透:华为首款黄金智能腕表来了 !
- 国庆后老年人购火车票半价?国铁集团称:该说法是假的,没有此项规定 !
- 火车出行不建议买短乘长:会造成列车超员 !
- 四电机千匹马力!宝马将推全新纯电M3:想买燃油的也别慌 !
12月17日消息,今日,腾讯混元宣布,腾讯混元世界模型1.5正式发布,只需输入文字描述或者图片即可创建专属的互动世界。
通过键盘、鼠标或手柄,即可实时控制虚拟相机的移动和转向,让用户可以像玩游戏一样自由探索AI生成的世界。

该模型首次开源业界最系统、最全面的实时世界模型框架,涵盖数据、训练、流式推理部署等全链路、全环节,并提出了重构记忆力、长上下文蒸馏、基于3D的自回归扩散模型强化学习等算法模块。



戏场景生成
混元世界模型1.5具备三大核心能力:
1、实时的交互生成:通过原创的Context Forcing蒸馏方案以及流式推理优化,模型可以按照24 FPS的速度生成720P的高清视频;
2、长范围的3D一致性:通过重构记忆机制(Reconstituted Memory),模型支持分钟级内容的几何一致性生成,可用于构建高质量的3D空间模拟器;
3、多样化的交互体验:混元世界模型可广泛适用于不同风格的游戏或者现实场景,以及第一和第三人称视角,也支持实时文本触发事件和视频续写等功能。
据介绍,混元世界模型1.5的核心是WorldPlay自回归扩散模型,采用Next-Frames-Prediction的视觉自回归任务进行训练,实现长范围几何一致性的实时交互式世界建模,破解了业界满足实时性与几何一致性的难题。

