Google Rilis DiffusionGemma, AI Open-source Kecepatan 4 Kali Lebih Kencang
Ilustrasi model AI DiffusionGemma yang dirilis Google 10 Juni 2026(Google)
16:06
11 Juni 2026

Google Rilis DiffusionGemma, AI Open-source Kecepatan 4 Kali Lebih Kencang

- Google resmi meluncurkan model kecerdasan buatan (artificial intelligence/AI) DiffusionGemma, Rabu (10/6/2026). 

Model yang dikembangkan oleh DeepMind, divisi AI yang ada di bawah naungan Google ini, merupakan kelanjutan dari lini AI open-source Gemma 4.

Namun, DiffusionGemma memiliki respons yang berbeda karena tidak menghasilkan output secara berurutan, sebagaimana model AI pada umumnya.

Untuk diketahui, sebagian besar model AI saat ini menghasilkan teks secara berurutan, token demi token dari kiri ke kanan. Teknik ini disebut autoregresif.

Sebaliknya, DiffusionGemma bekerja dengan teknik diffusion, yaitu dengan menghasilkan seluruh blok teks secara paralel, mirip seperti model pembuat gambar AI. Baru kemudian disempurnakan secara bertahap, hingga menjadi jawaban akhir.

Baca juga: Anthropic Sengaja Mengebiri AI Terkuatnya, Pengguna Protes

Menurut Google, pendekatan ini membuat kinerja DiffusionGemma lebih cepat dan lebih efisien, khususnya saat dijalankan secara lokal seperti di GPU Nvidia DGX atau GPU gaming ringan.

Secara teknis, DiffusionGemma merupakan model Mixture of Experts (MoE) dengan total 26 miliar parameter. Namun, hanya sekitar 3,8 miliar parameter yang aktif digunakan saat proses inferensi.

Karena itu, model ini masih dapat dijalankan pada perangkat dengan RAM sekitar 18 GB, termasuk GPU gaming kelas atas.

Lewat posting di blog resminya, Google membagikan hasil pengujian DiffusionGemma. Dalam pengujian menggunakan kartu grafis Nvidia RTX 5090, DiffusionGemma mampu menghasilkan sekitar 700 token per detik.

Ketika dijalankan menggunakan akselerator AI Nvidia H100, kecepatannya tembus 1.000 token per detik. Angka ini empat kali lebih cepat dibandingkan model Gemma autoregressive dengan ukuran yang sebanding.

Ketika dijalankan menggunakan akselerator AI Nvidia H100, kecepatan DiffusionGemma tembus 1.000 token per detik. Angka ini empat kali lebih cepat dibandingkan model Gemma autoregressive dengan ukuran yang sebanding.Google Ketika dijalankan menggunakan akselerator AI Nvidia H100, kecepatan DiffusionGemma tembus 1.000 token per detik. Angka ini empat kali lebih cepat dibandingkan model Gemma autoregressive dengan ukuran yang sebanding.

Menurut Google, kinerja tersebut bisa dicapai karena DiffusionGemma menggeser beban kerja dari bandwidth memori ke komputasi, sehingga model ini dapat menghasilkan hingga 256 token secara paralel dalam satu proses.

Dukungan tersebut dinilai cocok untuk berbagai tugas yang bersifat tidak linier. Misalnya pengeditan teks langsung, penyusunan urutan molekul, pembuatan grafik matematika, hingga pemecahan teka-teki Sudoku.

Sudoku selama ini dikenal sebagai tantangan bagi model AI konvensional, karena setiap angka bergantung pada angka lain yang belum tentu sudah dihasilkan.

Dengan kemampuan memperbaiki banyak token secara bersamaan, DiffusionGemma dinilai lebih mudah menemukan pola dan solusi yang konsisten.

Google menunjukkan demonstrasi bagaimana model DiffusionGemma dapat menyelesaikan puzzle Sudoku dengan melakukan koreksi berulang pada seluruh papan permainan hingga menemukan jawaban yang tepat.Google Google menunjukkan demonstrasi bagaimana model DiffusionGemma dapat menyelesaikan puzzle Sudoku dengan melakukan koreksi berulang pada seluruh papan permainan hingga menemukan jawaban yang tepat.

Google bahkan menunjukkan demonstrasi bagaimana model tersebut dapat menyelesaikan puzzle Sudoku dengan melakukan koreksi berulang pada seluruh papan permainan hingga menemukan jawaban yang tepat.

Baca juga: Internet Dunia Diam-diam Sedang Berubah, AI Jadi Pelaku Utamanya

Terlepas dari keunggulannya, Google mengakui bahwa teknik diffusion pada DiffusionGemma memiliki sejumlah keterbatasan. Beberapa di antaranya yaitu tingkat kesalahan yang lebih tinggi dibanding model AI autoregresif.

Pada model pembuat gambar, kesalahan pada beberapa piksel biasanya tidak terlalu memengaruhi hasil akhir. Namun dalam teks, kesalahan pada satu token saja dapat mengubah makna kalimat secara signifikan.

Selain itu, pendekatan diffusion juga kurang efisien untuk menghasilkan jawaban yang sangat pendek, karena model tetap harus menjalankan proses paralel yang cukup besar.

Alasan itulah yang membuat Google masih sebatas eksperimen pada DiffusionGemma, belum diadopsi ke Gemini yang digunakan secara luas lewat cloud.

Kendati demikian, DiffusionGemma sudah tersedia untuk diunduh oleh pengembang melalui platform Hugging Face. Model ini dirilis dengan lisensi Apache 2.0, sama seperti model Gemma generasi keempat lainnya, dihimpun KompasTekno dari Ars Technica.

Tag:  #google #rilis #diffusiongemma #open #source #kecepatan #kali #lebih #kencang

KOMENTAR