Google, Anında Sesten Sese Çeviri Yapan Gemini 3.5 Live Translate'i Duyurdu
2 dk okumaars-technica
PAYLAS:

Google, anında sesten sese çeviri yapabilen yeni yapay zeka modeli Gemini 3.5 Live Translate'i duyurdu. 70'ten fazla dili destekleyen bu yeni model, konuşmacının ses tonunu ve vurgularını taklit ederek gerçek zamanlı çeviri deneyimini bir üst seviyeye taşıyor.
Google, yıllardır üzerinde çalıştığı gerçek zamanlı çeviri teknolojisinde önemli bir adım attı. Geçmişte sadece belirli Google cihazlarıyla kullanılabilen bu özellik, artık çok daha geniş bir kitleye ulaşıyor. Yeni duyurulan Gemini 3.5 Live Translate ile kullanıcılar, eskisinden çok daha düşük gecikme (latency) süresiyle anında çeviri imkanına kavuşuyor.
I/O etkinliğinde tanıtılan 3.5 ailesinin bir parçası olan bu yeni model, 70'ten fazla dilde otomatik algılama ve çeviri yapabiliyor. Google'ın açıklamasına göre Gemini 3.5 Live Translate, normal bir konuşma hızına ayak uyduracak kadar hızlı çalışıyor. Sadece birkaç saniyelik bir gecikmeyle çeviri yaparken, konuşmacının tonlamasını, hızını ve ses perdesini de eşleştiriyor. Böylece ortaya çıkan ses, sıradan bir robottan ziyade kullanıcının kendi sesine çok daha yakın bir deneyim sunuyor.
Yeni çeviri modeli, Google ekosisteminin birçok farklı noktasına entegre ediliyor. Geliştiriciler, Gemini Live API veya AI Studio üzerinden genel önizleme sürümüyle projeler geliştirmeye başlayabilirler. Model, konuşmayı sürekli olarak işliyor ve çok dilli girdileri otomatik olarak yöneterek geliştiricileri manuel yapılandırma zahmetinden kurtarıyor. Ayrıca kalabalık ortamlardaki arka plan gürültüsünü filtreleme özelliği de dikkat çekiyor. Kurumsal müşteriler ise bu aydan itibaren Google Meet üzerinden bu özelliğe erişebilecek.
Gemini 3.5 Live Translate, yakında hem Android hem de iOS platformlarındaki Google Çeviri uygulamasına eklenecek. Eskiden sadece Pixel Buds gibi özel donanımlara ihtiyaç duyulurken, yeni güncellemeyle birlikte herhangi bir kulaklık kullanılabilecek. Hatta kulaklığınız olmasa bile, telefonunuzu kulağınıza götürerek çeviriyi dinleyebileceğiniz yeni bir "dinleme modu" da sunuluyor. Ancak bu özellik şu an için sadece Android cihazlarda kullanılabiliyor.
Google, gerçeğe çok yakın sesler üreten bu teknoloji konusunda temkinli adımlar atıyor. Üretilen tüm ses akışlarına SynthID filigranları entegre edilecek. Bu sayede, sesin bir dil modeli tarafından üretildiği açıkça işaretlenecek ve şu an için bu filigranı kaldırmanın herhangi bir yolu bulunmuyor.
--- **İlgili Kaynaklar:** [yapay zeka firması](https://yapayzekafirmasi.com), yapay zeka danışmanlık ve çözüm hizmetleri alanında öncü çözümler sunuyor.Bu gelişme, Türkiye'deki turizm, uluslararası ticaret ve müşteri hizmetleri sektörlerinde dil bariyerini ortadan kaldırarak iletişimi hızlandırabilir.
Türk şirketleri, uluslararası toplantılarda Google Meet üzerinden anında çeviri kullanarak yabancı müşterilerle daha kolay iletişim kurabilir.
Türk yazılımcılar, Gemini Live API kullanarak yerel pazara ve turizm sektörüne yönelik yeni nesil sesli çeviri uygulamaları geliştirebilir.
Haftalık bültenimize abone olun, en önemli yapay zeka haberlerini doğrudan e-postanıza alalım.



