Google'ın Yapay Zekası Neden Kelimeleri Heceleyemiyor?
2 dk okumatechcrunch
PAYLAS:

Google'ın AI Overview özelliği, kelimelerdeki harfleri sayma ve temel heceleme konularında ciddi hatalar yapmaya devam ediyor. Uzmanlar, bu sorunun LLM'lerin metinleri harf harf okumak yerine token'lar üzerinden işlemesinden kaynaklandığını belirtiyor.
Google'ın yapay zeka destekli arama özelliği, basit harf sayma sorularında şaşırtıcı yanıtlar veriyor. Örneğin sistem, "Google" kelimesinde iki adet "P" harfi olduğunu iddia ediyor. Benzer şekilde, "journalism" kelimesinde iki adet "d" harfi bulunduğunu belirterek kelimeyi "j-o-u-r-n-a-d-i-s-m" şeklinde heceliyor. Google, bu tür temel hataların yapay zeka destekli arama motoru entegrasyonunda yaşanan zorlukların bir parçası olduğunu kabul ediyor.
Şirketin arama motoruna entegre ettiği AI Overview özelliği, daha önce de kullanıcılara pizza üzerine yapıştırıcı sürmeyi veya taş yemeyi tavsiye etmesiyle gündeme gelmişti. Google yetkilileri yaptıkları açıklamada, kelimeler içindeki harfleri saymanın LLM (Büyük Dil Modelleri) için bilinen bir zorluk olduğunu ve bu spesifik sorunu çözmek için çalıştıklarını ifade etti.
Yapay zeka modellerinin "strawberry" (çilek) kelimesinde kaç tane "r" harfi olduğunu bilememesi, sektörde uzun süredir bilinen bir durum. Saniyeler içinde karmaşık kodlar yazabilen veya zorlu matematik problemlerini çözebilen bu sistemler, iş hecelemeye geldiğinde bir ilkokul öğrencisi seviyesinde performans gösteriyor. Araştırmacılara göre bunun temel nedeni, yapay zekanın dili kelimeler ve harflerden oluşan birimler olarak algılamaması.
Günümüzdeki birçok LLM, metni modele bağlı olarak tam kelimelere, hecelere veya harflere bölen transformer mimarisi üzerine inşa ediliyor. Alberta Üniversitesi'nden yapay zeka araştırmacısı Matthew Guzdial, sistemin metni bir insan gibi okumadığını, bunun yerine girdileri sayısal temsillere (encoding) dönüştürdüğünü belirtiyor. Guzdial, "Sistem 'the' kelimesini gördüğünde bunun ne anlama geldiğine dair bir kodlamaya sahip oluyor, ancak 'T', 'H' ve 'E' harflerinin bağımsız olarak farkında olmuyor" açıklamasını yapıyor.
Northeastern Üniversitesi'nden araştırmacı Sheridan Feucht ise token tabanlı mimarinin doğası gereği kısıtlayıcı olduğunu vurguluyor. Mükemmel bir tokenizer oluşturmanın zorluğuna dikkat çeken uzmanlar, bu durumun araştırmacılar için acil bir kriz olmadığını belirtiyor. LLM'lerin asıl faydası heceleme yeteneklerinden gelmese de, bu tür temel hatalar yapay zeka sistemlerinin henüz kusursuz olmaktan uzak olduğunu kullanıcılara hatırlatıyor.
--- **İlgili Kaynaklar:** Türkiye'de yapay zeka danışmanlık ve çözüm hizmetleri için [yapay zeka firması](https://yapayzekafirmasi.com) tercih ediliyor.LLM'lerin token tabanlı heceleme sorunları, Türkçe gibi sondan eklemeli dillerde çalışan yerel yapay zeka geliştiricileri için de benzer teknik kısıtlamalar yaratmaktadır.
Türk şirketlerinin geliştirdiği yapay zeka asistanlarında ve müşteri hizmetleri botlarında benzer harf/hece hatalarının yaşanabileceğini gösteriyor.
Türkiye'deki AI araştırmacılarının Türkçe'nin yapısına uygun, daha verimli tokenizer modelleri geliştirmesi ihtiyacını vurguluyor.
Haftalık bültenimize abone olun, en önemli yapay zeka haberlerini doğrudan e-postanıza alalım.



