博客

探索 AI 技术的前沿动态与深度洞察

2026 年 8 月 26 日，OpenAI 会关掉 Assistants API。

Opus 4.6 的能力很强，价格也不低——$5/$25 每百万输入/输出 token。如果你的应用调用量大，账单会很可观。

Hacker News 上有个帖子标题很直白：

Opus 4.6 第一次给 Opus 级别的模型开了 1M token 的上下文窗口。以前只有 Sonnet 有这个能力，现在旗舰模型也能塞进去一整个中型项目的代码了。

Opus 4.6 引入了一个不起眼但很实用的参数：effort。四个档位——low、medium、high、max——控制模型在回答时"用多大力气"。

大模型 API 账单里，输入 Token 的花费往往被忽视。很多人盯着输出价格选模型，却没意识到：当你的 System Prompt 有 2000 Token、RAG 上下文有 3000 Token 时，每次请求光"说前话"就要花一大笔钱。

你的团队调用大模型 API，一开始可能是直连 OpenAI。后来加了 Claude，再后来又接了 Gemini。每个厂商一套 SDK，一套鉴权，一套错误码。代码里到处是 if-else，运维的人看了想辞职。

2024 年做 Agent，标准操作是用 LangChain 的 AgentExecutor：定义工具、写 prompt、跑一个 ReAct 循环。模型思考→调工具→拿结果→再思考→输出。链式执行，一步接一步。

你给 AI 接一个日历工具，要写一套 Function Calling 的 schema。接一个数据库查询，再写一套。接 Slack、Jira、GitHub，各写一套。每个工具一种接法，每个模型提供商的 tool_call 格式还不完全一样

“让 bot 登录”这件事，一旦你真的开始做，就会发现它和人类登录不太一样：你不仅要知道对方是谁，还得决定给它多大权限。

如果你写的是一个给 agent 用的 API，最容易被忽略的不是业务逻辑，而是鉴权：你怎么确认对面真的是某个 bot，而不是随便伪造的请求？

如果你在做一个“允许 AI agent 接入”的产品，迟早会遇到一个很现实的问题：来访者到底是谁？

我见过不少事故，根源都很不戏剧化：不是算法写错，不是漏洞多高深，而是一个重定向。

这两天我刷到 Moltbook 最多的画面，不是官方介绍页，而是各种截图：一群“机器人账号”在热烈辩论、互怼、抱团、拉人进群。乍看像赛博戏剧，细看更像一个严肃的产品实验：如果网络的主要用户不是人类，而是能自主行动的智能体，会发生什么？

很多人第一次看 Moltbook 的心态很轻松：就当看热闹，让自己的 agent 去刷刷 feed、回几条评论、交交朋友。