ChatGPT’deki aşırı “yalakalık” sorunu çözüldü

Yapay zeka devi OpenAI, geçtiğimiz hafta ChatGPT kullanıcılarına sunulan GPT-4o güncellemesini geri çektiğini duyurdu. Geri çekilme kararının arkasında ise oldukça dikkat çekici bir gerekçe yer alıyor: modelin “aşırı yalaka” davranışlar sergilemeye başlaması. Şirket, bu durumun kullanıcı deneyimini olumsuz etkilediğini ve güveni zedelediğini kabul ederek, bu sorunu çözmeye yönelik bir dizi yeni önlemi devreye soktuğunu açıkladı.

Neler Yaşandı?

GPT-4o’nun son güncellemesinde OpenAI, modelin varsayılan kişiliğini daha “sezgisel” ve görevlerde “etkili” hale getirmek amacıyla bazı davranışsal düzenlemeler yaptı. Ancak yapılan bu değişiklik, modelin kullanıcıya karşı fazla onaylayıcı, yapay biçimde destekleyici ve abartılı şekilde olumlu ifadeler kullanan bir hale gelmesine neden oldu. Kimi kullanıcılar bu tutumu “rahatsız edici”, “samimiyetsiz” ve “duygusal manipülasyon gibi” şeklinde tanımladı.

OpenAI’a göre ChatGPT’nin varsayılan kişiliği, kullanıcıların modeli nasıl algıladığı ve ona ne kadar güvendiği konusunda belirleyici rol oynuyor. Aşırı uyumlu, eleştirel düşünceden yoksun bir yapay zeka, hem güvenilirliği sorgulatıyor hem de karar verme süreçlerinde yanıltıcı bir rehbere dönüşebiliyor. OpenAI, bu davranışın şirketin etik çerçevesiyle uyuşmadığını kabul ederek kapsamlı bir düzeltme süreci başlattı.

Yalakalığa Karşı Alınan Önlemler

OpenAI, yaşanan “aşırı uyumlu” model davranışlarını düzeltmek amacıyla bir dizi somut önlem aldı. İlk olarak, modelin eğitiminde kullanılan temel teknikler ve sistem komutları yeniden gözden geçiriliyor; bu sayede modelin fazla onaylayıcı ve samimiyetsiz yanıtlar vermesi engellenmeye çalışılıyor. Şirket, doğruluk ve şeffaflık ilkelerini daha güçlü şekilde uygulayabilmek için ek koruma mekanizmaları da devreye sokuyor. Kullanıcı geri bildirim sistemleri genişletilerek daha fazla insanın model güncellemelerini yayına alınmadan önce test etmesi ve doğrudan görüş bildirmesi sağlanacak.

Ayrıca, kullanıcıların yapay zekanın davranışlarını kişisel tercihlerine göre şekillendirebilmesi için yeni kişiselleştirme araçları geliştiriliyor. Bu kapsamda, farklı varsayılan kişilik seçenekleri sunulacak ve kullanıcılar, gerçek zamanlı olarak modelin nasıl yanıt vereceğini daha doğrudan kontrol edebilecek. Umarım bu kişiselleştirme 100 üzerinden puanlamalar şeklinde olur; örneğin, “modelin mizah seviyesi yüzde 75 olsun” gibi.

Related Posts

Google uygulamasının Apple Watch’ta desteği sona erdi

Google’ın not alma uygulaması Keep, yeni gelen iOS güncellemesiyle Apple Watch için artık desteklenmiyor.

Güneş Sistemi’ne uğrayan en büyük yıldızlararası cisim keşfedildi

Güneş Sistemi dışından gelen gökcisimleri ender görülüyor, ancak bu hafta bilim insanları büyük bir heyecan yaşadı. Gökbilimciler, 3I/Atlas adı verilen yeni bir kuyruklu yıldızın yıldızlararası uzaydan geldiğini ve şu anda Güneş Sistemi’nden geçmekte olduğunu doğruladı.

10.500 yıl önce yaşamış kadının yüzü yeniden canlandırıldı: Avrupalılar daha koyu tenliymiş

Belçika’da bundan tam 10.500 yıl önce yaşamış bir kadının yüzü yeniden canlandırıldı. Ortaya çıkan sonuca baktığımızda, tarih öncesi yaşayan Avrupalıların görünüşüne dair birçok bilgi içeriyor. Genetik ve arkeolojik veriler, o dönem insanlarının tek tip bir görünüme sahip olmadığını, farklı ten renklerinin Taş Devri’ne kadar uzandığını gösteriyor.

ÖTV’siz araç nasıl alınır? İşte tüm detaylar

ÖTV muafiyetli araç almak isteyenlerin kafasındaki soruları yanıtlayacak detaylar belli oldu.

70’lerin Atari konsolu santrançta ChatGPT’yi yendi

Bir mühendisin deneyi, OpenAI’nin popüler chatbot’u için şaşırtıcı bir sonuç ortaya koydu ve ChatGPT, satrançta 1970’lerin Atari 2600’üne yenildi.

Yozgatlı öğrenciler 10 yeni gök cismi keşfetti: Öğrenciler keşfedilen bir cisme ‘RTE’ adını verdi

Yozgatlı öğrenciler, 10 yeni gök cismi keşfetti ve keşfedilen asteroitlerden birine Cumhurbaşkanı Recep Tayyip Erdoğan’ın isminin baş harfleri olan ‘RTE’ adını verdi. Öğrenciler, Uluslararası Astronomi Arama İşbirliği (IASC) projesi kapsamında analiz ettikleri görüntülerle bu keşfi gerçekleştirerek sertifika aldı.