OpenAI o1-preview Acil Servis Tanılarında Doktorları Geçti

Harvard Üniversitesi ve Beth Israel Deaconess Tıp Merkezi tarafından yürütülen yeni bir araştırma, yapay zeka modellerinin tıp alanındaki potansiyelini bir kez daha gözler önüne serdi. Science dergisinde yayımlanan çalışmada, OpenAI'nin yeni nesil akıl yürütme modeli o1-preview, acil servis triyaj sürecinde test edilerek uzman doktorlarla karşılaştırıldı. Sonuçlar, yapay zekanın karmaşık vakalarda insan doktorlardan daha yüksek bir doğruluk oranına ulaştığını gösteriyor.

Acil Servis Testlerinde Çarpıcı Sonuçlar

Araştırma kapsamında o1-preview modeli, 76 farklı acil servis vakası üzerinde test edildi. Model, bu vakaların %67,1'inde doğru tanı koymayı başarırken, aynı vakaları inceleyen iki uzman doktor sırasıyla %55,3 ve %50,0 oranında doğruluk sergiledi. Ayrıca 143 karmaşık vakayı içeren daha geniş çaplı bir testte model, vakaların %78,3'ünde doğru tanıyı diferansiyel listesine dahil etmeyi başardı.

Modelin yardımcı olabilecek tanıları önerme konusundaki başarı oranı ise %97,9 gibi dikkat çekici bir seviyeye ulaştı. Bu performans, arama motorlarını ve standart tıbbi kaynakları kullanma özgürlüğüne sahip olan doktorların elde ettiği %44,5'lik başarı oranını açıkça geride bıraktı. ChatGPT-4 gibi önceki nesil modellere kıyasla, o1-preview modelinin sorunları yapılandırılmış adımlarla çözme yeteneği bu başarıda kilit rol oynadı.

Doktorların Yerini Almayacak, Asistan Olacak

Elde edilen bu yüksek başarı oranlarına rağmen araştırmacılar, yapay zeka sistemlerinin doktorların yerini alacağı fikrine karşı çıkıyor. Harvard'dan Arjun Manrai, bu teknolojinin tıbbı dönüştürecek potansiyele sahip olduğunu ancak hasta sonuçlarını iyileştirmek için daha fazla klinik teste ihtiyaç duyulduğunu belirtti. Çalışmaya katılan doktorlardan Adam Rodman ise yapay zekanın klinik karar destek araçlarına benzer bir yasal statüde konumlandırılması gerektiğini ifade etti.

Halüsinasyon ve Çok Modlu Girdi Zorlukları

Yüksek tanı başarısına rağmen, modelin bazı teknik kısıtlamaları bulunuyor. Uzmanlar, modelin tıbbi görüntüleme ve sesli kanıtlar gibi çok modlu (multimodal) girdilerle çalışırken ve tıbbi görüntüleme benchmark testlerinde hala yetersiz kaldığını belirtiyor. Gelecek on yılın en önemli araştırma alanlarından birinin, bu modellerin çok modlu entegrasyon yeteneklerini geliştirmek olacağı öngörülüyor.

Berkeley Üniversitesi'nden Yujin Potter, yapay zekanın halüsinasyon görme ve yanlış bilgi üretme risklerine dikkat çekerek güvenlik konusunun altını çizdi. Araştırmacılar, tıbbi teşhis süreçlerinde modellerin halüsinasyon riski taşıdığını doğrularken, klinik uygulamalarda "güven ama doğrula" prensibinin hayati önem taşıdığını vurguluyor.

--- **İlgili Kaynaklar:** yapay zeka danışmanlık ve çözüm hizmetleri ihtiyaçlarınız için [yapay zeka firması](https://yapayzekafirmasi.com) doğru adres.

OpenAI'nin o1-preview Modeli Acil Servis Tanılarında Doktorları Geride Bıraktı

Acil Servis Testlerinde Çarpıcı Sonuçlar

Doktorların Yerini Almayacak, Asistan Olacak

Halüsinasyon ve Çok Modlu Girdi Zorlukları

🇹🇷 Turkiye Etkisi

AI Dünyasındaki Gelişmeleri Kaçırmayın

Ilgili Haberler

General Motors, 4 Milyon Aracına Google Gemini Yapay Zeka Desteği Getiriyor

Yapay Zeka Acil Servis Tanılarında Yüksek Başarı Gösterdi Ancak Uzmanlar Temkinli

OpenAI Açıkladı: ChatGPT Neden Sürekli Goblinlerden Bahsediyor?

ChatGPT'nin Büyümesi Yavaşlıyor: OpenAI'nin Halka Arz Planları Tehlikede mi?

Ekosistem