Gemma 4 Hugging Face'te: Google'ın Paskalya sürprizini indirmek için

Gemma-4

Google Gemma 4'ü yayınladı: Yeni model ailesi (E2B - 31B) muhakeme yeteneklerini ve çok modluluğu doğrudan dizüstü bilgisayarlara ve akıllı telefonlara getiriyor. 256K token'a kadar büyük bir bağlam penceresi ve Apache 2.0 lisansı ile Google, ücretsiz yerel yapay zeka için bir örnek oluşturuyor.

Marc Herter (Çeviren DeepL / Ninh Duy), Yayınlandı 04/03/2026 🇺🇸 🇩🇪 ...

Paskalya'dan hemen önce Google, Hugging Face'e adresinde büyük bir sürpriz yaptıuzun zamandır beklenen Gemma 4 artık indirilebilir durumda. Lansman dört ana boyut sınıfını içeriyor: E2B, E4B, 26B A4B ve 31B. Tüm modeller, nihai bir cevap vermeden önce karmaşık problemleri adım adım işlemelerini sağlayan entegre bir "Düşünme" moduna sahiptir. Gemma 4'ün LM Studio gibi araçlarda yerel olarak kullanılabilir hale gelmesiyle birlikte sürümün yarattığı heyecan açıkça görülüyor ve Unsloth ilk çıkışından birkaç saat sonra.

Google'a görebu yeni nesil, ham boyuttan ziyade verimliliğe öncelik veriyor. Önceki Gemma 3 yinelemesine göre göze çarpan bir gelişme, mevcut serideki en küçük modellerin çeşitli kıyaslamalarda en büyük Gemma 3 modelinin performans seviyelerine şimdiden ulaşmış olmasıdır. Pratik anlamda bu, daha önce üst düzey donanım gerektiren görevlerin artık bir akıllı telefonda yerel olarak gerçekleştirilebileceği anlamına geliyor.

Mimari, kullanım amacına göre değişiklik gösteriyor. 31B varyantı nispeten klasik bir yapı kullanırken, 26B-A4B modeli bir Uzmanlar Karışımı (MoE) yaklaşımı kullanmaktadır. Modelin toplam 26 milyar parametresi olmasına rağmen, çıkarım sırasında (asıl hesaplama süreci) sadece yaklaşık dört milyar parametre etkinleştirilir. Bu, bilgi derinliğinden ödün vermeden yüksek hız ve orta düzeyde kaynak tüketimi sağlar. Daha küçük E2B ve E4B modelleri, modelin her katmanında her bir belirteç için özel bilgi sağlayan ve özellikle mobil işlemciler için performansı optimize eden Katman Başına Gömme (PLE) kullanır.

Modelin aynı anda "akılda" tutabileceği veri miktarı olan bağlam penceresinde de önemli gelişmeler var. E2B ve E4B modelleri 128.000 jetonu desteklerken, daha büyük modeller (26B A4B ve 31B) 256.000 jetona kadar işleyebilir. Bu kapasite, kullanıcıların devasa belgeleri veya karmaşık kod yapılarını tek bir geçişte analiz etmelerini sağlar.

Çoklu modalite Gemma 4'e derinlemesine entegre edilmiştir ve kullanıcıların metin ve görüntüleri tek bir istem içinde sorunsuz bir şekilde karıştırmasına olanak tanır. Modeller nesne tanıma, PDF belgelerini okuma ve Optik Karakter Tanıma (OCR) yeteneğine sahiptir. Ayrıca, uç modeller (E2B ve E4B) video ve ses formatları için yerel işleme özelliğine sahiptir ve otomatik konuşma tanıma gibi özellikleri mümkün kılar.

Bir diğer güçlü özellik ise "Fonksiyon Çağırma" için yerel destektir Bu, yapay zekanın sanal bir asistan olarak hareket etmesine, yazılım komutlarını bağımsız olarak yürütmesine veya görevleri tamamlamak için harici araçlar kullanmasına olanak tanır. Bu eğilimin açık bir örneği, şu anda Çin'de popüler olan ve YZ aracılarının bu ilkesine dayanan "OpenClaw" aracıdır. Gemma 4 ile bu tür sistemleri tamamen kendi cihazına yerleştirmek önemli ölçüde kolaylaşıyor.

Yasal çerçeve de memnuniyet verici bir değişiklik: modeller Apache 2.0 lisansı altında yayınlanıyor. Bu, yalnızca kullanımlarının ücretsiz olduğu değil, aynı zamanda tescilli projelere esnek bir şekilde entegre edilebilecekleri ve ticari olarak kullanılabilecekleri anlamına gelir - geliştiriciler için bariyeri büyük ölçüde düşürür. Daha önce, tüm Gemma modelleri Google tarafından yazılan özel bir lisans altında yayınlanıyordu.

İlk uygulamalı testler, bu modellerin etkileyici dilbilimsel yeteneklerinin ve artan verimliliğinin altını çiziyor. LM Studio'yu bir Bosgame M5gemma 4 31B modeli ile saniyede 10 jetondan (tok/s) biraz daha yüksek bir yanıt hızına ulaştık - ortalama bir okuyucunun bilgiyi işleyebileceğinden daha hızlı. Daha küçük modeller daha da çeviktir: E4B ve 26B A4B varyantları 40 tok/s'yi kolayca aşarken, en küçük model 60 tok/s'yi aşmaktadır. Bununla birlikte, en büyük Gemma 4 modelinin tüm bağlam boyutunu kullanmak isteyenler 128 GB RAM'i (Bosgame M5'te olduğu gibi) bile dar bulabilirler; AI kendisi için 80 GB'tan fazla talep edebilir ve diğer görevler için çok az bellek bırakabilir.