DeepSeek V3.1 Dirilis: AI Lebih Pintar dengan Memori Super Panjang

Buat kamu yang suka update soal AI, hati-hati bisa terbawa hype karena kabar terbaru dari DeepSeek—ini startup AI asal China—baru saja meluncurkan versi teranyar: DeepSeek V3.1. Kalau sebelumnya DeepSeek udah bikin geger dengan R1 yang murah tapi juara, maka V3.1 ini seakan melanjutkan gebrakan—tinggal menunggu angin pengaruhi Google dan OpenAI juga nih.

Apa Sih yang Beda dari V3.1?

DeepSeek cuma umumkan lewat grup kecil di WeChat—tanpa bikin riuh di media sosial—bahwa model V3.1 resmi dirilis. Tapi jangan salah, ini bukan update kecil. DeepSeek V3.1 punya kemampuan memori — atau “context window” — mencapai 128 ribu token, setara baca buku setebal 300–400 halaman dalam satu obrolan.

Model ini punya bayangan superhero di dunia AI. Dengan 685 miliar parameter, performanya mulai diadu sama model top lainnya seperti GPT-4.5 dan Claude versi terbaru.

Yang bikin menarik: model ini open-source, bisa diunduh dari Hugging Face. Ga perlu izin khusus. Langsung cus!.

Performanya Sekencang Apa?

Dari benchmark awal, DeepSeek V3.1 mampu menunjukkan kemampuan reasoning dan coding yang tajam. Nilai benchmark Aider mencetak skor 71,6%, sedikit lebih tinggi dari Claude Opus 4—padahal biaya operasionalnya jauh lebih rendah, “68 kali lebih murah”, kata salah seorang analis AI.

Yang bikin makin heboh: model ini punya arsitektur hybrid. Jadi, chat, reasoning, dan coding dipegang bersamaan tanpa salah satu ngeganggu yang lain. Talaah… keren.

Kemampuan teknis lainnya meliputi dukungan berbagai format tensor: dari BF16, FP32, bahkan FP8 eksperimental—ini penting buat developer supaya bisa optimasi sesuai hardware mereka.

Apa Kata Komunitas AI?

Pengguna subreddit r/LocalLLaMA langsung semangat:

“DeepSeek online model versi terbaru sudah V3.1, context window diperpanjang jadi 128k, boleh dites di situs dan aplikasi resmi. Jugaan, API-nya sama loh.

Tidak hanya itu, model ini sudah nongkrong di Hugging Face sebagai DeepSeek-V3.1-Base, yang siap diunduh dan dikembangkan lebih lanjut.

Latar Belakang Teknologi: Seberapa Canggih?

Sebagai penerus V3, yang merupakan model Mixture-of-Experts tak asing lagi (mengaktifkan sebagian parameter saja tiap token), V3.1 membawa peningkatan signifikan. V3 sendiri dilatih dengan hanya 2.788 juta jam GPU—itu murah banget dibanding model besar lain.