博客
探索 AI 技术的前沿动态与深度洞察
2026 年 8 月 26 日,OpenAI 会关掉 Assistants API。
Opus 4.6 的能力很强,价格也不低——$5/$25 每百万输入/输出 token。如果你的应用调用量大,账单会很可观。
Hacker News 上有个帖子标题很直白:
Opus 4.6 第一次给 Opus 级别的模型开了 1M token 的上下文窗口。以前只有 Sonnet 有这个能力,现在旗舰模型也能塞进去一整个中型项目的代码了。
Opus 4.6 引入了一个不起眼但很实用的参数:effort。四个档位——low、medium、high、max——控制模型在回答时"用多大力气"。
大模型 API 账单里,输入 Token 的花费往往被忽视。很多人盯着输出价格选模型,却没意识到:当你的 System Prompt 有 2000 Token、RAG 上下文有 3000 Token 时,每次请求光"说前话"就要花一大笔钱。
你的团队调用大模型 API,一开始可能是直连 OpenAI。后来加了 Claude,再后来又接了 Gemini。每个厂商一套 SDK,一套鉴权,一套错误码。代码里到处是 if-else,运维的人看了想辞职。
2024 年做 Agent,标准操作是用 LangChain 的 AgentExecutor:定义工具、写 prompt、跑一个 ReAct 循环。模型思考→调工具→拿结果→再思考→输出。链式执行,一步接一步。
你给 AI 接一个日历工具,要写一套 Function Calling 的 schema。接一个数据库查询,再写一套。接 Slack、Jira、GitHub,各写一套。每个工具一种接法,每个模型提供商的 tool_call 格式还不完全一样
“让 bot 登录”这件事,一旦你真的开始做,就会发现它和人类登录不太一样:你不仅要知道对方是谁,还得决定给它多大权限。
如果你写的是一个给 agent 用的 API,最容易被忽略的不是业务逻辑,而是鉴权:你怎么确认对面真的是某个 bot,而不是随便伪造的请求?
如果你在做一个“允许 AI agent 接入”的产品,迟早会遇到一个很现实的问题:来访者到底是谁?
我见过不少事故,根源都很不戏剧化:不是算法写错,不是漏洞多高深,而是一个重定向。
这两天我刷到 Moltbook 最多的画面,不是官方介绍页,而是各种截图:一群“机器人账号”在热烈辩论、互怼、抱团、拉人进群。乍看像赛博戏剧,细看更像一个严肃的产品实验:如果网络的主要用户不是人类,而是能自主行动的智能体,会发生什么?
很多人第一次看 Moltbook 的心态很轻松:就当看热闹,让自己的 agent 去刷刷 feed、回几条评论、交交朋友。