博客

探索 AI 技术的前沿动态与深度洞察

Gemini 3.1 Pro 智能体能力拆解:MCP Atlas 和 BrowseComp 跑分背后的真相

2026 年最热的 AI 话题不是"模型有多聪明",而是"模型能不能自己干活"。智能体(Agent)——让模型自主决策、调用工具、完成多步骤任务——是各家厂商押注最重的方向。

2026-02-25模型能力对比评测
把一小时视频扔给 Gemini 3.1 Pro,它能做什么,不能做什么

"原生多模态"这个说法 Google 用了很久,但我一直觉得它有点抽象。Gemini 3.1 Pro 支持图片、音频、视频、PDF 同时输入,听起来很全面。不过具体的上限和限制藏在 Vertex AI 的技术文档里,把它们挖出来才能知道实际

2026-02-25模型能力对比评测
Gemini 3.1 Pro 传了一小时视频进去,结果有点意外

Google 反复说 Gemini 3.1 Pro 是"原生多模态"模型——图片、音频、视频、PDF 都能一起处理。这个说法从 Gemini 1.0 就开始用了,到 Gemini 3.1 Pro 已经是第四代了。

2026-02-25模型能力对比评测
Gemini 3.1 Pro 多模态能力实测:一小时视频扔进去能看懂多少

Google 反复说 Gemini 3.1 Pro 是"原生多模态"模型——图片、音频、视频、PDF 都能一起处理。这个说法从 Gemini 1.0 就开始用了,到 Gemini 3.1 Pro 已经是第四代了。

2026-02-25模型能力对比评测
百万 token 的上下文窗口,Gemini 3.1 Pro 真的解决了「越长越烂」的问题吗

Gemini 3.1 Pro 支持 100 万 token 的输入上下文。官方宣传说解决了"迷失在中间"(Lost in the Middle)问题,100 万 token 下检索准确率接近 100%。听起来很厉害,不过我把 Model C

2026-02-25模型能力对比评测
Gemini 3.1 Pro 百万 token 上下文实测:塞进去的信息它真的记得住吗

Gemini 3.1 Pro 支持 100 万 token 的上下文窗口,是目前公开模型中最大的。Google 在宣传里说 Gemini 3.1 Pro 解决了"迷失在中间"问题,检索准确率接近 100%。

2026-02-25模型能力对比评测
Gemini 3.1 Pro 100 万 token 塞进去,它到底记住了多少

Gemini 3.1 Pro 支持 100 万 token 的上下文窗口,是目前公开模型中最大的。Google 在宣传里说 Gemini 3.1 Pro 解决了"迷失在中间"问题,检索准确率接近 100%。

2026-02-25模型能力对比评测
Gemini 3.1 Pro 跑分 77,我翻完了 Model Card 觉得没那么简单

2 月 19 日 Google 发布 Gemini 3.1 Pro,公告里最抢眼的数字是 ARC-AGI-2 拿了 77.1%,上一代 Gemini 3 Pro 只有 31.1%,翻了一倍多。不少自媒体当天就写出了"Gemini 3.1 P

2026-02-25模型能力对比评测
Gemini 3.1 Pro 基准测试没你想的那么简单

2月19日,Google 发布了 Gemini 3.1 Pro,公告里的数字很好看:ARC-AGI-2 得了 77.1%,比上一代 Gemini 3 Pro 的 31.1% 翻了一倍多。很多报道直接说"完胜 GPT-5.2 和 Claude

2026-02-25模型能力对比评测
Gemini 3.1 Pro 基准测试深度拆解:ARC-AGI-2 的 77 分到底说明了什么

2 月 19 日 Google 发布 Gemini 3.1 Pro,公告里最抢眼的数字是 ARC-AGI-2 拿了 77.1%,上一代 Gemini 3 Pro 只有 31.1%,翻了一倍多。不少自媒体当天就写出了"Gemini 3.1 P

2026-02-25模型能力对比评测
用 Gemini 3.1 Pro 做结构化输出加工具调用,先看清这个兼容性问题

如果你在用 Vercel AI SDK 接 Gemini,并且想同时用结构化输出(structured output)和工具调用(function calling / code execution),有一个坑值得提前说清楚——不是所有 Ge

2026-02-25企业AI应用实践
Gemini 3.1 Pro 用 Vercel AI SDK 接结构化输出,我踩过的坑

如果你在用 Vercel AI SDK(@ai-sdk/google)接 Gemini 3.1 Pro 或其他 Gemini 3 系列模型,想同时用结构化输出(structured output)和工具调用(function calling

2026-02-25企业AI应用实践
Gemini 3.1 Pro 结构化输出踩坑实录:Vercel AI SDK 兼容性问题汇总

如果你在用 Vercel AI SDK(@ai-sdk/google)接 Gemini 3.1 Pro 或其他 Gemini 3 系列模型,想同时用结构化输出(structured output)和工具调用(function calling

2026-02-25企业AI应用实践
谷歌杀疯了!Gemini 3.1 Pro 白菜价硬刚 GPT-5,这波是"穷鬼"的胜利

AI 圈最近打起来了,而且打得特别接地气——打价格战。

2026-02-25成本与定价分析
Gemini 3.1 Pro 的 thinking_level 怎么选、账单怎么控:开发者上手笔记

2 月 19 号 Google 发了 Gemini 3.1 Pro。宣传语照例是"most advanced model for complex tasks",我关心的是三件事:API 怎么接、thinking_level 怎么配、一个月下

2026-02-25成本与定价分析
上一页17172737475103下一页