Raksasa teknologi Google melalui tim AI Google DeepMind resmi memperkenalkan model kecerdasan buatan terbaru bernama Gemini 3.1 Flash-Lite. Model ini diklaim sebagai varian paling cepat dan paling hemat biaya di lini Gemini 3 Series.
Berdasarkan laporan KompasTekno, Gemini 3.1 Flash-Lite dirancang untuk menangani beban kerja dalam jumlah besar atau high volume workloads, tanpa mengorbankan efisiensi biaya.
Salah satu fitur unggulan model ini adalah dukungan pengaturan tingkat pemikiran yang bisa disesuaikan melalui platform AI Studio dan Vertex AI. Dengan fitur tersebut, developer dapat mengatur seberapa dalam model memproses atau “berpikir” sebelum menghasilkan jawaban. Artinya, konsumsi komputasi dan biaya dapat disesuaikan dengan kebutuhan proyek.
Secara umum, Gemini 3.1 Flash-Lite disebut lebih mumpuni dibandingkan Gemini 2.5 Flash. Model ini memiliki latensi lebih rendah, kemampuan 2,5 kali lebih cepat dalam Time to First Answer Token, serta peningkatan kecepatan output hingga 45 persen.
Dalam pengujian benchmark, Gemini 3.1 Flash-Lite mencatat skor Elo 1432 poin di platform Arena.ai Leaderboard. Skor tersebut setara dengan model GPT-5.1 milik OpenAI dan Qwen3-Max-Preview milik Alibaba. Selain itu, model ini mencatat skor 76,8 persen dalam pengujian penalaran MMMU-Pro dan 86,9 persen dalam pengujian pengetahuan sains GPQA Diamond.
Harga Lebih Murah dari Versi Sebelumnya
Dari sisi biaya, Gemini 3.1 Flash-Lite dipatok 0,25 dolar AS atau sekitar Rp 4.200 per 1 juta input token, serta 1,50 dolar AS atau sekitar Rp 25.400 per 1 juta output token.
Sebagai perbandingan, Gemini 2.5 Flash sebelumnya dibanderol 0,30 dolar AS atau sekitar Rp 5.000 per 1 juta input token dan 2,50 dolar AS atau sekitar Rp 42.000 per 1 juta output token. Dengan demikian, model terbaru ini menawarkan efisiensi biaya yang lebih baik untuk developer maupun perusahaan.
Model ini mulai digulirkan dalam tahap preview untuk developer melalui Gemini API di Google AI Studio. Selain itu, Gemini 3.1 Flash-Lite juga sudah tersedia untuk pengguna enterprise melalui platform Vertex AI.
Google menyebut sejumlah perusahaan seperti Latitude, Cartwheel, dan Whering telah mulai memanfaatkan model ini pada tahap awal untuk menangani persoalan skala besar. Beberapa contoh penggunaan yang disorot antara lain terjemahan dalam volume besar, moderasi konten otomatis, pembuatan antarmuka dan dashboard, simulasi instruksi kompleks, hingga pengisian otomatis wireframe e commerce dengan ratusan produk.
Langkah ini menunjukkan ambisi Google untuk memperkuat posisinya dalam persaingan model AI generatif, terutama di segmen yang membutuhkan performa tinggi dengan biaya operasional yang tetap terkendali.
Referensi:
KompasTekno