博客
探索 AI 技术的前沿动态与深度洞察
Google I/O 2025 发布 AI Ultra 订阅的时候,很多人的第一反应是:谁会花 250 美元一个月买这个?
最近 Google DeepMind 发布了 Project Genie,把 Genie 3 世界模型包装成了一个消费级产品。用户输入一段文字描述,系统就能生成一个可以用方向键探索的 3D 世界。
2026 年 1 月 29 日,Google DeepMind 正式发布 Project Genie,这是基于 Genie 3 世界模型的首个消费级产品。用户通过文字描述即可生成可交互的 3D 虚拟环境,实时探索。
前两天刷推特,看到一堆人在讨论 Google 的新玩意儿。
想理解世界模型的架构,有几个选择:
搜索"Genie robot training",你会找到两个不同的东西:
DeepMind 有两个看起来独立的项目:
Genie 3 最让人意外的功能之一是 Promptable World Events。简单说:你可以在探索世界的过程中,用文字命令改变世界。
DeepMind 说 Genie 3 可以用来训练 AI 智能体。思路是:在虚拟世界里大量练习,然后迁移到现实世界。
DeepMind 的 Genie 系列论文只说了"我们做到了什么",没开源代码,没公开数据集。你想复现?门都没有。
传统游戏引擎和世界模型,做的是同一件事:创造可交互的虚拟环境。但技术路线完全不同。
最近有篇 Medium 文章的标题很吓人:"Google DeepMind Genie 3's Billion-Frame Secret: The $100M AI Engine That Just Made 40% of Indie De
The Verge 记者 Sean Hollister 是最早拿到 Project Genie 测试资格的人之一。他的测评标题很直接:"Google's AI helped me make bad Nintendo knockoffs"。
DeepMind 在 Genie 3 的论文和博客里详细描述了模型架构、训练方法、能力展示。但有一个问题他们几乎不提:训练数据从哪来?
用 Midjourney 生成图片的时候,你写一段提示词就行。用 Sora 生成视频,也是一段提示词。