Gemini 3.1 Pro

Google 最强 Pro 级 AI 模型，在 ARC-AGI-2 上取得 77.1% 的突破性得分——是前代的两倍以上。专为最复杂的挑战而生，配备 100 万 token 上下文窗口与原生多模态理解能力。

ARC-AGI-2 得分

77.1%

上下文窗口

100 万 token

最大输出

64K token

人类终极考试

44.4%

试用 Gemini 3.1 Pro

Gemini 3.1 Pro background

立即体验

试用 Gemini 3.1 Pro

体验 Google 最强推理模型——输入提示，感受突破性智能的实力。

Live

试试示例提示词

5 积分 / 条

↵ 发送

登录后试用

核心能力

Gemini 3.1 Pro 能做什么

先进的多模态推理能力，专为需要深度思考而非简单回答的复杂现实任务而设计。

Gemini 3.1 Pro

SOTA Performance

MMLU92%

HumanEval87%

MATH79%

01

突破性推理

ARC-AGI-2 得分 77.1%，是 Gemini 3 Pro 的两倍以上，能够解决全新逻辑模式和复杂问题。

02

原生多模态理解

在单一上下文中原生处理文本、图像、音频、视频和代码，实现跨模态的丰富推理与综合分析。

03

智能体工作流

通过 Google Antigravity、Gemini CLI 和 Vertex AI 优化复杂智能体任务，大规模编排多步骤工作流。

基准测试

业界领先的性能表现

Gemini 3.1 Pro 在最严格的 AI 基准测试中创下新纪录，展示了真正的推理突破。

推理

77.1%

ARC-AGI-2

在全新逻辑模式求解中比 Gemini 3 Pro 高出一倍以上。

知识

44.4%

人类终极考试

高级领域专业知识测试创纪录得分，超越 GPT-5.2（34.5%）和 Gemini 3 Pro（37.5%）。

工程

1.27x

RE-Bench（ML 研发）

ML 研究工程任务人类归一化得分 1.27，将 LLM 微调运行时间从 300 秒缩短至 47 秒。

对比

显著超越

对比 Gemini 2.5 Pro

在需要增强推理和多模态能力的基准测试中，全面显著超越 Gemini 2.5 Pro。

安全

提升

多语言安全

相较于 Gemini 3.0 Pro，多语言安全评分提升，拒绝语气更加精细化。

上下文

100 万 token

上下文利用

业界领先的 100 万 token 上下文窗口，可处理完整代码库、研究文献和复杂工作流。

核心功能

Gemini 3.1 Pro 核心功能

为开发者、企业和研究人员设计的全面功能集，应对最复杂的 AI 挑战。

100 万 Token 上下文

处理完整代码库、长篇研究文献或深层嵌套工作流——在复杂会话中将大型任务图谱保留在记忆中。

64K Token 输出

生成详尽的长篇响应——从完整系统设计到综合报告——无需分段处理。

代码驱动动画

直接从文本提示生成可用于网站的 SVG 动画，产出清晰可缩放的视觉效果，文件体积极小。

复杂系统综合

桥接复杂 API 与用户友好设计——构建实时仪表盘、配置遥测数据流、可视化实时数据。

交互式 3D 设计

编写具有手势追踪和生成式音频的沉浸式 3D 体验——轻松原型化感官丰富的界面。

安全与可靠性

改进的多语言安全评分、精细化的拒绝语气，以及严格的前沿安全框架合规性，适用于生产部署。

为什么选择

为什么使用 Gemini 3.1 Pro

面向复杂企业任务，兼顾高阶推理、多模态理解与长上下文执行能力。

基准验证的推理优势

ARC-AGI-2 等基准结果说明其在陌生逻辑模式与复杂问题求解上的能力更强。

原生多模态工作流

可在同一流程中联合处理文本、图像、音频、视频与代码，适合复杂任务编排。

100万上下文处理大型资料

可在更少上下文切换下分析长文档、大型代码库与多阶段计划。

如何使用

Gemini 3.1 Pro 的实战用法

通过结构化方法提升 API 接入、研究分析与企业自动化场景的输出质量。

1

先按模态拆解任务

在提示前明确哪些步骤需要文本、图像、音频或代码推理，减少无效 token 消耗。

2

采用阶段化提示

将任务拆为分析、综合、输出三个阶段，提升复杂流程的可控性与稳定性。

3

做模型对比评估

基于你的真实基准任务对比 Gemini 与替代模型，持续跟踪质量、时延与成本。

相关模型

在 Fluxchat 中对比其他前沿模型。

GPT-5.4

OpenAI 面向专业工作的模型，适合编程、推理、工具调用与长上下文任务

Claude Sonnet 4.6

Anthropic 最强 Sonnet，智能接近 Opus 级别

Claude Opus 4.6

Anthropic 最智能的模型，100万 token 上下文

GLM-5

智谱 AI 旗舰模型，开源 SOTA 编程与智能体性能

FAQ

常见问题

还有其他问题？请联系我们的支持团队。

还有问题？

我们的支持团队随时准备为您提供帮助。

Gemini 3.1 Pro

在 Fluxchat 体验 Gemini 3.1 Pro

在 Fluxchat 上试用 Google 最强推理模型，体验突破性的 ARC-AGI-2 性能与 100 万 token 上下文能力。

开始对话查看定价