1,050,000 輸入 Token
高達約 105 萬輸入與 65,536 輸出 Token,適合長文檔與多輪對話而少分割。
Gemini 3.1 Flash Lite
高吞吐、可重試、對成本敏感的任務首選:在 LimaxAI 聊天中與更強 Gemini 型號共用工作臺,把大批量翻譯、打標與抽取放在 Flash Lite,邊緣案例再升級。

功能與限制
規劃生產集成時最重要的規格;具體開關以 LimaxAI 聊天內實際展示為準。
高達約 105 萬輸入與 65,536 輸出 Token,適合長文檔與多輪對話而少分割。
支援文本、圖像、影片、音頻與 PDF 輸入,輸出為文本,適合抽取與總結。
支援思考鏈與結構化輸出,獲得可靠、機器可讀的結果。
函數調用、代碼執行與搜尋接地(以平台接入為準),適合輕量 Agent 子步驟。
上下文緩存與批處理 API 適合重複性或大規模負載(API 場景;聊天以產品為準)。
Flash Lite 是 Gemini 家族中偏經濟的路線,價格與吞吐通常比更高檔 Flash 更重要。
應用場景
下列場景與公開 Gemini 3.1 Flash Lite 敘事一致;配圖為說明性視覺。

翻譯回填、打標隊列、抽取與第一輪分類——作為更大架構裡的低成本處理層,邊緣案例再升級更強模型。

單次請求發送文本、圖像、影片、音頻或 PDF,處理長文檔與批量內容,無需過度分割上下文。

承擔多模型流水線裡的低成本 Agent 子步驟、檢索清洗與結構化預處理(以聊天內工具能力為準)。
平台價值
與 GPT、Claude 等模型同一聊天工作臺,無需單獨維護 Gemini 控制檯。
先把翻譯、抽取、分類流量路由到 Flash Lite,更難任務再切到 Gemini 3.1 Pro 或其他前沿模型。
按 LimaxAI 公示的聊天積分規則扣減,便於與團隊內其他模型對比成本。
沿用 LimaxAI 聊天流式管線,適合長回覆與高吞吐迭代。
Gemini 家族
Flash Lite 成本最低;需要更強多模態或前沿推理可升級同家族型號。
公開規格隨版本更新;LimaxAI 可用條目以模型列表為準。
| 維度 | 3.1 Flash Lite | 3 Flash Preview | 3.1 Pro |
|---|---|---|---|
| 定位 | 低成本高吞吐 | 更強多模態 | 前沿推理 |
| 上下文 | 約 1.05M 輸入 | 隨版本 | 隨版本 |
| 輸出上限 | 65K | 隨版本 | 隨版本 |
| 典型任務 | 翻譯 · 抽取 · 分類 | 通用 Flash | 複雜推理 |
| 選型建議 | 成本與吞吐優先 | 能力升級 | 品質優先 |
如何開始
在 LimaxAI 試用 Gemini 3.1 Flash Lite 的三步。
註冊並打開對話頁,在模型列表中查找 Gemini 3.1 Flash Lite 或名稱相近的條目。
從翻譯、抽取或短分類 prompt 開始,觀察延遲與品質是否滿足流水線需求。
對難例切換到 Gemini 3.1 Pro 等更強模型,並在價格頁查看積分消耗。
常見問答
是的。公開資料將 Flash Lite 定位為 Flash 家族中的低成本路線,更適合高吞吐任務;價格與吞吐通常比更高檔 Flash 更重要。
公開資料為最多約 1,050,000 輸入 Token 與 65,536 輸出 Token。LimaxAI 實際上限以模型列表與網關策略為準。
公開資料支援文本、圖像、影片、音頻與 PDF 輸入,輸出為文本,適合抽取、總結與多模態文檔處理(以聊天內附件能力為準)。
API 場景常用 gemini-3.1-flash-lite-preview。LimaxAI 聊天請在模型列表中選擇對應條目,名稱可能隨營運配置變化。
翻譯、抽取、分類、打標、文檔處理等可重試、成本敏感任務優先 Flash Lite;更看重結果品質或任務更難時再升級更強 Gemini。
公開資料稱不支援圖像生成、音頻生成、Live API 與 Google Maps grounding;更適合低成本文本輸出工作流。
按所選聊天模型與 LimaxAI 公示的積分規則計費,請以價格頁與個人消費明細為準。
在 LimaxAI 對話中試用
打開聊天,選擇 Flash Lite,從翻譯隊列、抽取或分類草稿開始驗證。