1.050.000 token đầu vào
Tới ~1.05M đầu vào và 65.536 token đầu ra — tài liệu và thread dài với ít chia nhỏ tay hơn.
Gemini 3.1 Flash Lite
Thiết kế cho throughput cao, thân thiện retry và nhạy chi phí: chạy backfill dịch, hàng đợi gán nhãn và trích xuất trên Flash Lite trong LimaxAI, rồi đưa edge case lên Gemini mạnh hơn.

Khả năng & giới hạn
Thông số chính cho lập kế hoạch sản xuất; tùy chọn chính xác theo những gì LimaxAI hiển thị trong chat.
Tới ~1.05M đầu vào và 65.536 token đầu ra — tài liệu và thread dài với ít chia nhỏ tay hơn.
Văn bản, ảnh, video, âm thanh và PDF vào — văn ra — cho trích xuất và tóm tắt.
Suy luận và đầu ra tuân schema cho kết quả máy đọc được tin cậy.
Function calling, thực thi code và grounding search (theo tích hợp) cho bước agent nhẹ.
Context caching và API batch cho khối lượng công việc lặp hoặc lớn (kịch bản API; chat theo sản phẩm).
Flash Lite là tuyến kinh tế trong gia đình Gemini — throughput và giá thường thắng chất lượng thuần.
Ứng dụng
Khớp định vị công khai Gemini 3.1 Flash Lite; hình minh họa.

Backfill dịch, hàng đợi gán nhãn, trích xuất và phân loại sơ bộ như lớp rẻ — đưa outlier lên tầng trên.

Gửi văn, ảnh, video, âm thanh hoặc PDF trong một request cho tài liệu dài và nội dung batch.

Bước agent rẻ, dọn retrieval và tiền xử lý có cấu trúc trong pipeline đa mô hình (theo công cụ chat).
Vì sao LimaxAI
Cùng không gian làm việc chat với GPT, Claude và các mô hình frontier khác — không cần console Gemini riêng.
Định tuyến dịch, trích xuất và phân loại sang Flash Lite; đưa case khó lên Gemini 3.1 Pro hoặc khác.
Tính phí theo quy tắc điểm LimaxAI để team so sánh thẳng.
Cùng pipeline streaming với các mô hình chat khác cho trả lời dài và lặp.
Gia đình Gemini
Flash Lite là tuyến chi phí thấp nhất; nâng trong gia đình khi cần đa phương thức hoặc suy luận mạnh hơn.
Spec công khai tiến hóa; mục có sẵn theo danh sách mô hình LimaxAI.
| Chiều | 3.1 Flash Lite | 3 Flash Preview | 3.1 Pro |
|---|---|---|---|
| Định vị | Chi phí thấp · throughput cao | Đa phương thức mạnh hơn | Suy luận frontier |
| Ngữ cảnh | ~1.05M đầu vào | Tuỳ bản phát hành | Tuỳ bản phát hành |
| Đầu ra tối đa | 65K | Tuỳ | Tuỳ |
| Tác vụ điển hình | Dịch · trích · phân loại | Flash tổng quát | Suy luận khó |
| Chọn khi | Chi phí & throughput trước | Nâng khả năng | Chất lượng trước |
Bắt đầu
Thử Gemini 3.1 Flash Lite trong chat LimaxAI.
Mở Chat và chọn Gemini 3.1 Flash Lite (hoặc mục tên gần nhất).
Bắt đầu với dịch, trích xuất hoặc prompt phân loại ngắn; quan sát độ trễ và chất lượng.
Chuyển case khó sang Gemini 3.1 Pro và theo dõi credit trên trang bảng giá.
Câu hỏi thường gặp
Có — tài liệu công khai định vị Flash Lite là tuyến Flash kinh tế cho khối lượng công việc throughput cao nơi giá và throughput thường quan trọng hơn đỉnh chất lượng.
Tài liệu công khai nêu tới ~1.050.000 token đầu vào và 65.536 token đầu ra. Giới hạn LimaxAI theo danh sách mô hình và gateway.
Spec công khai hỗ trợ đầu vào văn, ảnh, video, âm thanh và PDF với đầu ra văn — phụ thuộc khả năng đính kèm trong chat.
Luồng API thường dùng gemini-3.1-flash-lite-preview. Trong chat LimaxAI, chọn mục danh sách khớp — tên có thể đổi theo cấu hình.
Ở Flash Lite cho dịch, trích, phân loại, gán nhãn và xử lý tài liệu nhạy chi phí, thân retry; nâng khi chất lượng hoặc độ khó đòi hỏi.
Tài liệu công khai liệt kê không có sinh ảnh/âm thanh, Live API hoặc grounding Google Maps — tốt nhất cho workflow đầu ra văn chi phí thấp.
Theo quy tắc điểm LimaxAI cho mô hình chat đã chọn — xem trang bảng giá và lịch sử dùng.
Thử Gemini 3.1 Flash Lite trong chat
Mở Chat, chọn Flash Lite và bắt đầu với dịch, trích xuất hoặc phân loại.