OpenAI, API'sine Yeni Gerçek Zamanlı Ses ve Çeviri Özellikleri Ekledi
2 dk okumatechcrunch
PAYLAS:

OpenAI, geliştiricilerin gerçek zamanlı çeviri, transkripsiyon ve sesli asistan uygulamaları geliştirmesini sağlayan yeni sesli zeka özelliklerini API'sine eklediğini duyurdu. Yeni modeller arasında GPT-Realtime-Translate ve GPT-Realtime-Whisper öne çıkıyor.
OpenAI, geliştiricilerin kullanıcılarla akıcı bir şekilde konuşabilen, konuşmaları anında metne dökebilen ve çeviri yapabilen uygulamalar oluşturmasına olanak tanıyan yeni sesli zeka özelliklerini API üzerinden erişime açtı. Şirketin tanıttığı en dikkat çekici yeniliklerden biri olan GPT-Realtime-Translate, kullanıcıyla eşzamanlı olarak çeviri hizmeti sunmak üzere tasarlandı. Bu özellik, 70'ten fazla giriş dilini anlayabiliyor ve 13 farklı dilde sesli çıktı verebiliyor.
Bunun yanı sıra, etkileşimler gerçekleştiği anda canlı konuşmayı metne dönüştürme yeteneği sunan GPT-Realtime-Whisper adlı yeni bir transkripsiyon aracı da kullanıma sunuldu. OpenAI, bu yeni modellerin gerçek zamanlı sesi basit bir soru-cevap formatından çıkarıp; dinleyen, akıl yürüten ve konuşma ilerledikçe aksiyon alabilen işlevsel ses arayüzlerine dönüştürdüğünü belirtti.
Bu güncellemelerin özellikle müşteri hizmetleri kapasitesini artırmak isteyen şirketler için ideal bir çözüm olması bekleniyor. Ayrıca eğitim, medya, etkinlik yönetimi ve içerik üretici platformları gibi çok çeşitli alanlarda da yapay zeka destekli ses çözümlerinin yaygınlaşacağı öngörülüyor.
Kurumsal açıdan oldukça faydalı görünen bu araçların kötüye kullanımını engellemek için çeşitli güvenlik önlemleri de alındı. Şirket, spam, dolandırıcılık veya diğer çevrimiçi istismar türlerini önlemek amacıyla sisteme belirli tetikleyiciler yerleştirdiğini ve zararlı içerik kurallarını ihlal eden konuşmaların anında durdurulacağını açıkladı.
Tüm bu yeni ses modelleri OpenAI'ın Realtime API paketine dahil edilmiş durumda. Fiyatlandırma tarafında Translate ve Whisper hizmetleri dakikalık olarak ücretlendirilirken, ana model olan GPT-Realtime-2'nin kullanımı token tüketimi üzerinden faturalandırılacak.
--- **İlgili Kaynaklar:** Profesyonel yapay zeka danışmanlık ve çözüm hizmetleri çözümleri için [yapay zeka firması](https://yapayzekafirmasi.com) sayfasını ziyaret edin.Türkiye'deki yazılım şirketleri ve girişimler, bu yeni API özelliklerini kullanarak çok dilli müşteri hizmetleri ve eğitim uygulamaları geliştirebilir.
Türk şirketleri, çağrı merkezleri ve müşteri hizmetleri operasyonlarında gerçek zamanlı çeviri ve sesli asistanları kullanarak maliyetleri düşürebilir ve küresel müşterilere daha kolay ulaşabilir.
Sesli yapay zeka alanında çalışan yerli girişimlerin ürün geliştirme süreçleri hızlanabilir ve bu alandaki inovasyonlar yeni yatırım fırsatları doğurabilir.
Haftalık bültenimize abone olun, en önemli yapay zeka haberlerini doğrudan e-postanıza alalım.



