Prediksi Elon Musk: Uang dan Gaji Bisa Hilang di Masa Depan
Orang terkaya di dunia sekaligus CEO SpaceX, Elon Musk, kembali melontarkan pandangan futuristik yang memicu perdebatan global. Kali ini, Musk...
Read more
Buat kamu yang suka update soal AI, hati-hati bisa terbawa hype karena kabar terbaru dari DeepSeek—ini startup AI asal China—baru saja meluncurkan versi teranyar: DeepSeek V3.1. Kalau sebelumnya DeepSeek udah bikin geger dengan R1 yang murah tapi juara, maka V3.1 ini seakan melanjutkan gebrakan—tinggal menunggu angin pengaruhi Google dan OpenAI juga nih.
DeepSeek cuma umumkan lewat grup kecil di WeChat—tanpa bikin riuh di media sosial—bahwa model V3.1 resmi dirilis. Tapi jangan salah, ini bukan update kecil. DeepSeek V3.1 punya kemampuan memori — atau “context window” — mencapai 128 ribu token, setara baca buku setebal 300–400 halaman dalam satu obrolan.
Model ini punya bayangan superhero di dunia AI. Dengan 685 miliar parameter, performanya mulai diadu sama model top lainnya seperti GPT-4.5 dan Claude versi terbaru.
Yang bikin menarik: model ini open-source, bisa diunduh dari Hugging Face. Ga perlu izin khusus. Langsung cus!.
Dari benchmark awal, DeepSeek V3.1 mampu menunjukkan kemampuan reasoning dan coding yang tajam. Nilai benchmark Aider mencetak skor 71,6%, sedikit lebih tinggi dari Claude Opus 4—padahal biaya operasionalnya jauh lebih rendah, “68 kali lebih murah”, kata salah seorang analis AI.
Yang bikin makin heboh: model ini punya arsitektur hybrid. Jadi, chat, reasoning, dan coding dipegang bersamaan tanpa salah satu ngeganggu yang lain. Talaah… keren.
Kemampuan teknis lainnya meliputi dukungan berbagai format tensor: dari BF16, FP32, bahkan FP8 eksperimental—ini penting buat developer supaya bisa optimasi sesuai hardware mereka.
Pengguna subreddit r/LocalLLaMA langsung semangat:
“DeepSeek online model versi terbaru sudah V3.1, context window diperpanjang jadi 128k, boleh dites di situs dan aplikasi resmi. Jugaan, API-nya sama loh.
Tidak hanya itu, model ini sudah nongkrong di Hugging Face sebagai DeepSeek-V3.1-Base, yang siap diunduh dan dikembangkan lebih lanjut.
Sebagai penerus V3, yang merupakan model Mixture-of-Experts tak asing lagi (mengaktifkan sebagian parameter saja tiap token), V3.1 membawa peningkatan signifikan. V3 sendiri dilatih dengan hanya 2.788 juta jam GPU—itu murah banget dibanding model besar lain.
Ikuti Saluran Resmi Trenmedia di WhatsApp!
Dapatkan berita terkini, tren viral, serta tips inspiratif langsung dari redaksi.
📱 Saluran Trenmedia 🍳 Saluran Resep Masakan Viral
Klik dan bergabung sekarang – update terbaru langsung masuk ke WhatsApp kamu!
Musim hujan sering membuat pemilik motor merasa percuma mencuci kendaraan. Hari ini dicuci, besok sudah kotor lagi. Tidak jarang motor...
Jalan kaki dikenal sebagai aktivitas fisik sederhana yang mudah dilakukan siapa saja. Namun muncul pertanyaan, berapa sebenarnya jumlah langkah kaki...