博客

探索 AI 技术的前沿动态与深度洞察

Google I/O 2025 发布 AI Ultra 订阅的时候，很多人的第一反应是：谁会花 250 美元一个月买这个？

最近 Google DeepMind 发布了 Project Genie，把 Genie 3 世界模型包装成了一个消费级产品。用户输入一段文字描述，系统就能生成一个可以用方向键探索的 3D 世界。

2026 年 1 月 29 日，Google DeepMind 正式发布 Project Genie，这是基于 Genie 3 世界模型的首个消费级产品。用户通过文字描述即可生成可交互的 3D 虚拟环境，实时探索。

前两天刷推特，看到一堆人在讨论 Google 的新玩意儿。

想理解世界模型的架构，有几个选择：

搜索"Genie robot training"，你会找到两个不同的东西：

DeepMind 有两个看起来独立的项目：

Genie 3 最让人意外的功能之一是 Promptable World Events。简单说：你可以在探索世界的过程中，用文字命令改变世界。

DeepMind 说 Genie 3 可以用来训练 AI 智能体。思路是：在虚拟世界里大量练习，然后迁移到现实世界。

DeepMind 的 Genie 系列论文只说了"我们做到了什么"，没开源代码，没公开数据集。你想复现？门都没有。

传统游戏引擎和世界模型，做的是同一件事：创造可交互的虚拟环境。但技术路线完全不同。

最近有篇 Medium 文章的标题很吓人："Google DeepMind Genie 3's Billion-Frame Secret: The $100M AI Engine That Just Made 40% of Indie De

The Verge 记者 Sean Hollister 是最早拿到 Project Genie 测试资格的人之一。他的测评标题很直接："Google's AI helped me make bad Nintendo knockoffs"。

DeepMind 在 Genie 3 的论文和博客里详细描述了模型架构、训练方法、能力展示。但有一个问题他们几乎不提：训练数据从哪来？

用 Midjourney 生成图片的时候，你写一段提示词就行。用 Sora 生成视频，也是一段提示词。