1,050,000 입력 토큰
입력 최대 약 105만·출력 65,536 토큰 — 긴 문서·스레드를 덜 쪼갤 수 있습니다.
Gemini 3.1 Flash Lite
고처리량·재시도 친화·비용 민감 작업용: LimaxAI에서 번역 백필·라벨링 대기열·추출을 Flash Lite로 돌리고, 엣지 케이스는 더 강한 Gemini로 올리세요.

기능과 한도
운영 계획용 요약. 실제 토글은 LimaxAI 채팅 표시를 따릅니다.
입력 최대 약 105만·출력 65,536 토큰 — 긴 문서·스레드를 덜 쪼갤 수 있습니다.
텍스트·이미지·영상·오디오·PDF 입력, 텍스트 출력 — 추출·요약에 맞습니다.
추론과 스키마 준수 출력으로 기계가 읽기 쉬운 결과를 안정적으로.
함수 호출·코드 실행·검색 접지(연동별) 등 가벼운 에이전트 단계에.
컨텍스트 캐싱·배치 API로 반복·대량 부하에(API. 채팅은 제품 정책).
Flash Lite는 패밀리 내 경제 루트 — 처리량과 가격이 종종 순수 품질을 이깁니다.
활용 시나리오
공개 Gemini 3.1 Flash Lite 포지셔닝에 맞춘 예시(이미지는 연출용).

번역 백필·라벨링 대기열·추출·1차 분류를 값싼 레이어로 — 이상치는 상류로 승격.

한 요청에 텍스트·이미지·영상·오디오·PDF를 넣어 긴 문서·배치 콘텐츠 처리.

저렴한 에이전트 하위 단계, 검색·정리, 구조화 전처리를 다모델 파이프라인에(채팅 도구 기준).
LimaxAI에서 쓰는 이유
GPT·Claude 등과 같은 채팅 워크스페이스 — 별도 Gemini 콘솔 불필요.
번역·추출·분류는 Flash Lite, 어려운 건 Gemini 3.1 Pro 등으로.
LimaxAI 포인트 규칙으로 팀 비교가 단순합니다.
긴 응답·반복도 다른 채팅 모델과 같은 파이프라인.
Gemini 패밀리
Flash Lite는 최저비용 루트 — 패밀리 내 업그레이드로 멀티모달·추론을 강화.
공개 스펙은 변합니다. LimaxAI 모델 목록이 기준입니다.
| 항목 | 3.1 Flash Lite | 3 Flash Preview | 3.1 Pro |
|---|---|---|---|
| 포지션 | 저비용 · 고처리량 | 더 강한 멀티모달 | 프론티어 추론 |
| 컨텍스트 | 입력 약 1.05M | 릴리스별 상이 | 릴리스별 상이 |
| 최대 출력 | 65K | 릴리스별 | 릴리스별 |
| 대표 작업 | 번역 · 추출 · 분류 | 일반 Flash | 고난이도 추론 |
| 선택 기준 | 비용·처리량 우선 | 역량 상향 | 품질 우선 |
시작하기
LimaxAI 채팅에서 Gemini 3.1 Flash Lite를.
채팅에서 Gemini 3.1 Flash Lite(또는 가장 가까운 표기)를 고릅니다.
번역·추출·짧은 분류 지시문으로 시작해 지연·품질을 봅니다.
어려운 케이스는 Gemini 3.1 Pro로 바꾸고 요금 페이지에서 크레딧을 확인합니다.
자주 묻는 질문
네 — 공개 설명은 Flash Lite를 고처리량 작업의 경제 Flash 루트로 두며, 종종 가격·처리량이 최고 품질보다 중요할 때를 가정합니다.
공개 문서는 입력 최대 약 1,050,000·출력 65,536 토큰을 인용합니다. LimaxAI 한도는 모델 목록·게이트웨이 규칙을 따릅니다.
공개 스펙은 텍스트·이미지·영상·오디오·PDF 입력과 텍스트 출력을 지원한다고 합니다 — 채팅 첨부 기능에 따릅니다.
API 흐름에서는 gemini-3.1-flash-lite-preview 등이 쓰입니다. LimaxAI 채팅에서는 목록의 해당 항목을 고르며 — 설정 변경에 따라 이름이 바뀔 수 있습니다.
재시도 친화·비용 민감 번역·추출·분류·라벨링·문서 처리는 Flash Lite에 두고, 품질·난이도가 요구하면 올리세요.
공개 자료는 이미지·오디오 생성, Live API, Google Maps 접지 없음을 열거합니다 — 저비용 텍스트 출력 워크플로에 맞습니다.
선택한 채팅 모델의 LimaxAI 포인트 규칙을 따릅니다 — 요금 페이지·이용 내역을 확인하세요.
채팅에서 Gemini 3.1 Flash Lite 체험
채팅에서 Flash Lite를 고르고 번역·추출·분류부터 시작하세요.