1,050,000 输入 Token
高达约 105 万输入与 65,536 输出 Token,适合长文档与多轮对话而少分割。
Gemini 3.1 Flash Lite
高吞吐、可重试、对成本敏感的任务首选:在 LimaxAI 聊天中与更强 Gemini 型号共用工作台,把大批量翻译、打标与抽取放在 Flash Lite,边缘案例再升级。

功能与限制
规划生产集成时最重要的规格;具体开关以 LimaxAI 聊天内实际展示为准。
高达约 105 万输入与 65,536 输出 Token,适合长文档与多轮对话而少分割。
支持文本、图像、视频、音频与 PDF 输入,输出为文本,适合抽取与总结。
支持思考链与结构化输出,获得可靠、机器可读的结果。
函数调用、代码执行与搜索接地(以平台接入为准),适合轻量 Agent 子步骤。
上下文缓存与批处理 API 适合重复性或大规模负载(API 场景;聊天以产品为准)。
Flash Lite 是 Gemini 家族中偏经济的路线,价格与吞吐通常比更高档 Flash 更重要。
应用场景
下列场景与公开 Gemini 3.1 Flash Lite 叙事一致;配图为说明性视觉。

翻译回填、打标队列、抽取与第一轮分类——作为更大架构里的低成本处理层,边缘案例再升级更强模型。

单次请求发送文本、图像、视频、音频或 PDF,处理长文档与批量内容,无需过度分割上下文。

承担多模型流水线里的低成本 Agent 子步骤、检索清洗与结构化预处理(以聊天内工具能力为准)。
平台价值
与 GPT、Claude 等模型同一聊天工作台,无需单独维护 Gemini 控制台。
先把翻译、抽取、分类流量路由到 Flash Lite,更难任务再切到 Gemini 3.1 Pro 或其他前沿模型。
按 LimaxAI 公示的聊天积分规则扣减,便于与团队内其他模型对比成本。
沿用 LimaxAI 聊天流式管线,适合长回复与高吞吐迭代。
Gemini 家族
Flash Lite 成本最低;需要更强多模态或前沿推理可升级同家族型号。
公开规格随版本更新;LimaxAI 可用条目以模型列表为准。
| 维度 | 3.1 Flash Lite | 3 Flash Preview | 3.1 Pro |
|---|---|---|---|
| 定位 | 低成本高吞吐 | 更强多模态 | 前沿推理 |
| 上下文 | 约 1.05M 输入 | 随版本 | 随版本 |
| 输出上限 | 65K | 随版本 | 随版本 |
| 典型任务 | 翻译 · 抽取 · 分类 | 通用 Flash | 复杂推理 |
| 选型建议 | 成本与吞吐优先 | 能力升级 | 质量优先 |
如何开始
在 LimaxAI 试用 Gemini 3.1 Flash Lite 的三步。
注册并打开对话页,在模型列表中查找 Gemini 3.1 Flash Lite 或名称相近的条目。
从翻译、抽取或短分类 prompt 开始,观察延迟与质量是否满足流水线需求。
对难例切换到 Gemini 3.1 Pro 等更强模型,并在价格页查看积分消耗。
常见问答
是的。公开资料将 Flash Lite 定位为 Flash 家族中的低成本路线,更适合高吞吐任务;价格与吞吐通常比更高档 Flash 更重要。
公开资料为最多约 1,050,000 输入 Token 与 65,536 输出 Token。LimaxAI 实际上限以模型列表与网关策略为准。
公开资料支持文本、图像、视频、音频与 PDF 输入,输出为文本,适合抽取、总结与多模态文档处理(以聊天内附件能力为准)。
API 场景常用 gemini-3.1-flash-lite-preview。LimaxAI 聊天请在模型列表中选择对应条目,名称可能随运营配置变化。
翻译、抽取、分类、打标、文档处理等可重试、成本敏感任务优先 Flash Lite;更看重结果质量或任务更难时再升级更强 Gemini。
公开资料称不支持图像生成、音频生成、Live API 与 Google Maps grounding;更适合低成本文本输出工作流。
按所选聊天模型与 LimaxAI 公示的积分规则计费,请以价格页与个人消费明细为准。
在 LimaxAI 对话中试用
打开聊天,选择 Flash Lite,从翻译队列、抽取或分类草稿开始验证。