Gemini 3.1 Flash Lite
Dùng thử

Gemini 3.1 Flash Lite

Gemini chi phí thấp cho dịch, trích xuất và tài liệu

Thiết kế cho throughput cao, thân thiện retry và nhạy chi phí: chạy backfill dịch, hàng đợi gán nhãn và trích xuất trên Flash Lite trong LimaxAI, rồi đưa edge case lên Gemini mạnh hơn.

  • ~1.05M ngữ cảnh
  • Đầu ra tối đa 65K
  • Đầu vào đa phương thức
  • Tìm kiếm công cụ
  • Chi phí cực thấp
Gemini chi phí thấp cho dịch, trích xuất và tài liệu

Khả năng & giới hạn

Khả năng lõi & giới hạn

Thông số chính cho lập kế hoạch sản xuất; tùy chọn chính xác theo những gì LimaxAI hiển thị trong chat.

1.050.000 token đầu vào

Tới ~1.05M đầu vào và 65.536 token đầu ra — tài liệu và thread dài với ít chia nhỏ tay hơn.

Đầu vào đa phương thức

Văn bản, ảnh, video, âm thanh và PDF vào — văn ra — cho trích xuất và tóm tắt.

Thinking + đầu ra có cấu trúc

Suy luận và đầu ra tuân schema cho kết quả máy đọc được tin cậy.

Function + công cụ

Function calling, thực thi code và grounding search (theo tích hợp) cho bước agent nhẹ.

Cache + batch

Context caching và API batch cho khối lượng công việc lặp hoặc lớn (kịch bản API; chat theo sản phẩm).

Lane chi phí cực thấp

Flash Lite là tuyến kinh tế trong gia đình Gemini — throughput và giá thường thắng chất lượng thuần.

Ứng dụng

Kịch bản khớp nhất

Khớp định vị công khai Gemini 3.1 Flash Lite; hình minh họa.

Xử lý khối lớn chi phí thấp

Xử lý khối lớn chi phí thấp

Backfill dịch, hàng đợi gán nhãn, trích xuất và phân loại sơ bộ như lớp rẻ — đưa outlier lên tầng trên.

Đa phương thức ~1M ngữ cảnh

Đa phương thức ~1M ngữ cảnh

Gửi văn, ảnh, video, âm thanh hoặc PDF trong một request cho tài liệu dài và nội dung batch.

Agent & Tìm kiếm công cụ

Agent & Tìm kiếm công cụ

Bước agent rẻ, dọn retrieval và tiền xử lý có cấu trúc trong pipeline đa mô hình (theo công cụ chat).

Vì sao LimaxAI

Vì sao dùng trên LimaxAI

Cùng không gian làm việc chat với GPT, Claude và các mô hình frontier khác — không cần console Gemini riêng.

Lane rẻ trong stack của bạn

Định tuyến dịch, trích xuất và phân loại sang Flash Lite; đưa case khó lên Gemini 3.1 Pro hoặc khác.

Credit thống nhất

Tính phí theo quy tắc điểm LimaxAI để team so sánh thẳng.

UX chat streaming

Cùng pipeline streaming với các mô hình chat khác cho trả lời dài và lặp.

Gia đình Gemini

Gia đình Gemini (định tính)

Flash Lite là tuyến chi phí thấp nhất; nâng trong gia đình khi cần đa phương thức hoặc suy luận mạnh hơn.

Spec công khai tiến hóa; mục có sẵn theo danh sách mô hình LimaxAI.

Chiều3.1 Flash Lite3 Flash Preview3.1 Pro
Định vịChi phí thấp · throughput caoĐa phương thức mạnh hơnSuy luận frontier
Ngữ cảnh~1.05M đầu vàoTuỳ bản phát hànhTuỳ bản phát hành
Đầu ra tối đa65KTuỳTuỳ
Tác vụ điển hìnhDịch · trích · phân loạiFlash tổng quátSuy luận khó
Chọn khiChi phí & throughput trướcNâng khả năngChất lượng trước

Bắt đầu

Bắt đầu chỉ với ba bước

Thử Gemini 3.1 Flash Lite trong chat LimaxAI.

  1. Đăng nhập LimaxAI

    Mở Chat và chọn Gemini 3.1 Flash Lite (hoặc mục tên gần nhất).

  2. Gửi tác vụ thử

    Bắt đầu với dịch, trích xuất hoặc prompt phân loại ngắn; quan sát độ trễ và chất lượng.

  3. Đưa outlier lên tầng cao

    Chuyển case khó sang Gemini 3.1 Pro và theo dõi credit trên trang bảng giá.

Câu hỏi thường gặp

Câu hỏi thường gặp

Flash Lite có rẻ hơn các bậc Flash cao hơn không?

Có — tài liệu công khai định vị Flash Lite là tuyến Flash kinh tế cho khối lượng công việc throughput cao nơi giá và throughput thường quan trọng hơn đỉnh chất lượng.

Cửa sổ ngữ cảnh lớn đến đâu?

Tài liệu công khai nêu tới ~1.050.000 token đầu vào và 65.536 token đầu ra. Giới hạn LimaxAI theo danh sách mô hình và gateway.

Xử lý PDF và video được không?

Spec công khai hỗ trợ đầu vào văn, ảnh, video, âm thanh và PDF với đầu ra văn — phụ thuộc khả năng đính kèm trong chat.

Nên dùng ID mô hình nào?

Luồng API thường dùng gemini-3.1-flash-lite-preview. Trong chat LimaxAI, chọn mục danh sách khớp — tên có thể đổi theo cấu hình.

Khi nào ở Flash Lite, khi nào nâng cấp?

Ở Flash Lite cho dịch, trích, phân loại, gán nhãn và xử lý tài liệu nhạy chi phí, thân retry; nâng khi chất lượng hoặc độ khó đòi hỏi.

Không hỗ trợ gì?

Tài liệu công khai liệt kê không có sinh ảnh/âm thanh, Live API hoặc grounding Google Maps — tốt nhất cho workflow đầu ra văn chi phí thấp.

Tính phí trên LimaxAI thế nào?

Theo quy tắc điểm LimaxAI cho mô hình chat đã chọn — xem trang bảng giá và lịch sử dùng.

Thử Gemini 3.1 Flash Lite trong chat

Chạy tác vụ thật trên Flash Lite

Mở Chat, chọn Flash Lite và bắt đầu với dịch, trích xuất hoặc phân loại.