Google Yapay Zeka Neden Heceleyemiyor? LLM ve Token Sorunu

Google'ın AI Overview özelliği, kelimelerdeki harfleri sayma ve temel heceleme konularında ciddi hatalar yapmaya devam ediyor. Uzmanlar, bu sorunun LLM'lerin metinleri harf harf okumak yerine token'lar üzerinden işlemesinden kaynaklandığını belirtiyor.

Google'ın yapay zeka destekli arama özelliği, basit harf sayma sorularında şaşırtıcı yanıtlar veriyor. Örneğin sistem, "Google" kelimesinde iki adet "P" harfi olduğunu iddia ediyor. Benzer şekilde, "journalism" kelimesinde iki adet "d" harfi bulunduğunu belirterek kelimeyi "j-o-u-r-n-a-d-i-s-m" şeklinde heceliyor. Google, bu tür temel hataların yapay zeka destekli arama motoru entegrasyonunda yaşanan zorlukların bir parçası olduğunu kabul ediyor.

Şirketin arama motoruna entegre ettiği AI Overview özelliği, daha önce de kullanıcılara pizza üzerine yapıştırıcı sürmeyi veya taş yemeyi tavsiye etmesiyle gündeme gelmişti. Google yetkilileri yaptıkları açıklamada, kelimeler içindeki harfleri saymanın LLM (Büyük Dil Modelleri) için bilinen bir zorluk olduğunu ve bu spesifik sorunu çözmek için çalıştıklarını ifade etti.

Yapay Zeka Neden Heceleyemiyor?

Yapay zeka modellerinin "strawberry" (çilek) kelimesinde kaç tane "r" harfi olduğunu bilememesi, sektörde uzun süredir bilinen bir durum. Saniyeler içinde karmaşık kodlar yazabilen veya zorlu matematik problemlerini çözebilen bu sistemler, iş hecelemeye geldiğinde bir ilkokul öğrencisi seviyesinde performans gösteriyor. Araştırmacılara göre bunun temel nedeni, yapay zekanın dili kelimeler ve harflerden oluşan birimler olarak algılamaması.

Günümüzdeki birçok LLM, metni modele bağlı olarak tam kelimelere, hecelere veya harflere bölen transformer mimarisi üzerine inşa ediliyor. Alberta Üniversitesi'nden yapay zeka araştırmacısı Matthew Guzdial, sistemin metni bir insan gibi okumadığını, bunun yerine girdileri sayısal temsillere (encoding) dönüştürdüğünü belirtiyor. Guzdial, "Sistem 'the' kelimesini gördüğünde bunun ne anlama geldiğine dair bir kodlamaya sahip oluyor, ancak 'T', 'H' ve 'E' harflerinin bağımsız olarak farkında olmuyor" açıklamasını yapıyor.

Token Mimarisi ve Gelecek Beklentileri

Northeastern Üniversitesi'nden araştırmacı Sheridan Feucht ise token tabanlı mimarinin doğası gereği kısıtlayıcı olduğunu vurguluyor. Mükemmel bir tokenizer oluşturmanın zorluğuna dikkat çeken uzmanlar, bu durumun araştırmacılar için acil bir kriz olmadığını belirtiyor. LLM'lerin asıl faydası heceleme yeteneklerinden gelmese de, bu tür temel hatalar yapay zeka sistemlerinin henüz kusursuz olmaktan uzak olduğunu kullanıcılara hatırlatıyor.

--- **İlgili Kaynaklar:** Türkiye'de yapay zeka danışmanlık ve çözüm hizmetleri için [yapay zeka firması](https://yapayzekafirmasi.com) tercih ediliyor.

Google'ın Yapay Zekası Neden Kelimeleri Heceleyemiyor?

Yapay Zeka Neden Heceleyemiyor?

Token Mimarisi ve Gelecek Beklentileri

🇹🇷 Turkiye Etkisi

AI Dünyasındaki Gelişmeleri Kaçırmayın

Ilgili Haberler

Illinois, ABD'nin En Kapsamlı Yapay Zeka Güvenlik Yasa Tasarısını Onayladı

In more good news for Amazon, Snowflake signs $6B deal with AWS for AI CPU chips

MiniMax, Uzun Bağlamlarda 15.6 Kat Daha Hızlı Yeni M3 Modelini Duyurdu

Merck ve Mastercard'ın Yapay Zeka Başarısının Sırrı: Önce Sağlam Altyapı

Ekosistem