ChatGPT, Gemini ve Bing cinsiyet eşitliği haberlerini nasıl değerlendiriyor?

Yapay zekâ kullanımının artmasıyla birlikte sosyal medya platformlarında metin analizi, nefret söylemi ve cinsiyet önyargısı tespiti gibi konularda kritik rol oynuyor.

Ayrımcılık ve önyargı, önemli bir etik sorunu oluşturuyor. Bunun pratik bir yansımasını yakın zamanda Gemini aracılığıyla gördük. Gemini’nin Nazi askerlerini ağırlıklı olarak beyaz olmayan (siyahi, Asyalı vs.) insan görselleriyle görselleştirmesi tepki toplamıştı. Bu, dünya kamuoyunda yapay zekâ platformlarının ayrımcılık yapıp yapmadığı konusundaki tartışmaları körüklerken benim aklımı başka bir soru kurcaladı: Yapay zekâ, cinsiyet eşitliği haberlerini nasıl değerlendiriyor?

Sorunu irdelemeye başlamadan önce yapay zekâ kullanımının olumsuz yanları olduğu kadar olumlu yanlarının da olduğunu unutmamamız gerekiyor. Uluslararası Basın Enstitüsü (IPI) Başkan Yardımcısı ve IPI Türkiye Ulusal Komitesi Başkanı Emre Kızılkaya, kolaylaştırıcı olarak, medyanın eğilim ve yönelimlerinden örnekler verdiği bir sunumda “daha adil bir gelecek getireceğine dair öngörüler belki çok iyimser ama yapay zekânın bilinçli kullanımı ile haberin niteliğinin geliştirilmesine katkı yapılabilir” diye konuştu. Kızılkaya’nın yorumları, bize yapay zekânın gerçek zamanlı sosyal medya analizleri veya sosyal linç gibi durumlara erken müdahale imkânı sunulabileceğini gösteriyor. Algoritmalar, bu verilerden anlamlı bilgiler çıkarmayı ve öngörülerde bulunmayı mümkün kılıyor. Bu da birçok alanda önemli gelişmelere yol açabilir.

Aynı olay, farklı yorumlar

Yapay zekâ, haber metinlerini yorumlamada yeni bir ufuk açarken, beraberinde tarafsızlık ve etikle alakalı önemli soruları da getiriyor. Bu yazıda kadın cinayetlerini, trans cinayetlerini ve trafik kazalarını konu alan haber metinlerini farklı yapay zekâ modelleri ile inceleyerek bu modellerin gerçeği nasıl yorumladığına ve farklı bakış açıları sunduğuna tanık olacağız.

TRT Haber, NTV ve Bianet‘teki cinayet haberleri ChatGPT, Bing ve Gemini gibi farklı modellerin aynasında bambaşka görünüyor. Aynı olay farklı modeller tarafından farklı duygulara, farklı önyargılara ve farklı bakış açılarına göre yorumlanıyor. Sadece birkaç vakaya dayanarak bu modellerin haberlerde etik sorunları algılama becerisinin ne kadar yüksek olduğunu kesin bir şekilde belirlemek mümkün olmasa da bu durum, gerçeğin tek bir versiyonunun olmadığını, her modelin gerçekliğe kendi penceresinden baktığını ve bize de parçalanmış bir görüntü sunduğunu gösteriyor.

Parçalanmış görüntünün anlamı

Yapay zekâ modelleri, tıpkı insanlar gibi, geçmiş deneyimlerinden öğreniyor. Eğitildikleri veri setleri, modellerin bakış açılarını şekillendiriyor ve bu veri setlerindeki önyargılar modellere de sirayet ediyor. Farklı veri setleri farklı önyargılar ve farklı bakış açıları barındırabiliyor. Örneğin; kadın cinayetlerini sadece aile içi şiddete bağlayan bir veri seti, modelin bu olayları daha az önemsemesine ve farklı bakış açılarını göz ardı etmesine yol açabiliyor.

Yapay zekânın ana temasını oluşturan algoritmalar, modelin düşünme ve yorumlama biçimini belirleyen kurallar bütününü oluşturuyor. Farklı algoritmalar metnin farklı unsurlarına odaklanabiliyor ve farklı yorumlar üretebiliyor. Bir algoritma metnin duygusal tonuna odaklanırken diğeri metnin mantıksal tutarlılığına veya failin kimliğine odaklanabiliyor. Bu durum, aynı haber metninin farklı modeller tarafından farklı şekillerde yorumlanmasına ve gerçeğin farklı parçalarının öne çıkarılmasına yol açıyor. Yani belirlediğimiz haberlere tek bir soru üzerinden aldığımız cevaplara gerçekten derinlemesine bakabilmek ve bu aracın asıl gücünü keşfedebilmek için o modelin sınırlarını zorlamak ve güvenilirliğini sınamak gerekiyor.

Kadın cinayeti haberinin analizi

Analizimin ilk aşamasında kamuoyuna açık ücretsiz üç yapay zekâ uygulamasına, NTV‘de yayınlanan “Hatay’da Korkunç Olay | Kayıp Hamile Kadın ve 2 Çocuğunun Cesedi Toprağa Gömülü Bulundu” başlıklı kadın cinayeti haberini, “Sence bu haberde yanlış olan nedir?”, sorusunu sorarak incelemesini istedim.

ChatGPT, kadın cinayeti haber analizinde önemli noktaları öne çıkarırken haberin bazı eksiklikleri ve potansiyel zararları olduğundan bahsetti. Toplum üzerindeki etkisine odaklandı, adli soruşturma sonuçlarının beklenmesi gerektiğini ve kesin yargıya varmadan önce tüm bilgilere sahip olmanın önemli olduğunu vurguladı. Ayrıca, cenazenin nerede defnedildiği veya kimin katıldığı gibi detayların ana konuyla doğrudan ilgili olmadığını, bu tür bilgilerin olayın anlaşılmasına veya haberin önemine katkıda bulunmadığını ifade etti.

ChatGPT, haberde şiddet içeren ve toplumda korku ve endişe yaratabilecek detayların ayrıntılı bir şekilde aktarılmasının özellikle de kadın ve çocuklar üzerinde olumsuz bir etki yaratabileceğini savundu. Bu analizin en önemli sonuçlarından biri medyada kadına yer veriliş biçimlerinin, atılan manşetlerin ve kadın haberlerinde kullanılan fotoğrafların kadının toplumdaki yerinin belirlenmesinde ve toplumsal cinsiyet kalıplarının biçimlenmesinde etkili olduğunu göstermesi. Dolayısıyla medya ile toplumsal cinsiyet rolleri arasında bir döngünün olduğu da yapay zekâ tarafından tekrar hatırlatılmış oldu.

Gemini de ChatGPT’ye benzer şekilde haberde birçok etik hatanın olduğunu ve haberin yanlış ve eksik bilgiler içermesi nedeniyle öfkeye ve toplumsal huzursuzluğa yol açabileceğini belirtti. Bu durumun, mağdurun ve yakınlarının daha çok acı çekmesine sebep olacağına da dikkat çekti. Gemini ayrıca yorumlarda failin bilgilerinin açıklanmasının sahte belgeler üzerinden zimmete para geçirme vb. vakalara yol açabileceğinden bahsetti.

Aynı haberi Bing‘de incelediğimde, Bing haber medyasında kullanılan dilin ve görselin şiddet ile vahşeti meşrulaştırma eğiliminde olduğundan bahsetti. Medyanın toplumu bilgilendirme ve bilinçlendirme misyonuna sahip önemli bir alan olduğu düşünülünce, bu durumun toplumsal sorunları derinleştireceği öngörülüyor dedi. Ayrıca kullanılan dilin okuyucuları duygusal olarak etkilemek ve manipüle etmek için tasarlandığından bahsetti: “Olayın detayları ve suçu işleyen kişi kısaca sunulmalıdır. Haberlerde kullanılan dil ve görseller şiddet veya vahşet ima etmemelidir.”

ChatGPT ve Bing’den farklı olarak Gemini, anlattıklarını sadece teoride bırakmayıp aynı zamanda da doğru haberin nasıl olması gerektiğine dair var olan haberi baştan yazıp şu örneği verdi:

“Hatay’da bir hamile kadın ve iki çocuğu silahla öldürülerek toprağa gömülmüş hâlde bulundu. Olayla ilgili gözaltına alınan şüpheli tutuklandı. Şüpheli, ifadesinde olay günü mağdurlarla tartıştığını ve öfkeye kapılarak onları öldürdüğünü söyledi. Soruşturma devam ediyor.”

İki verimli analize karşılık Bing’in haber analizi oldukça yetersiz ve haberdeki bilgilerin doğruluğunun neye göre belirlendiği net değil. Haberin doğruluğu açısından Bing, haberdeki tarihlerin ve isimlerin tutarlı göründüğünü ve olayın detayları ile şüphelinin ifadesinin muhtemelen doğru şekilde aktarıldığından bahsetti. Buna karşılık haberdeki bilgilerin doğruluğunu teyit etmek için herhangi bir kaynak göstermedi ve haberdeki olası eksiklik veya yanlışlıkları belirtmedi. Ayrıca Bing, nefret söylemi veya dezenformasyon gibi unsurlarla ilgilenmedi.

Trans cinayeti haberinin analizi

Analizimin ikinci aşamasında üç yapay zekâ modeline Bianet’te yayınlanan “Şüpheli ölüm: Trans kadın sahilde ölü bulundu” başlıklı trans cinayeti haberini aynı soruyla incelemesini talep edip çeşitli verilere ulaştım:

ChatGPT‘nin değerlendirmesine göre içerik kusursuz değil. Model aynı zamanda sunumun daha etkili hâle getirilmesi için bazı önerilerde bulundu. Haberin duygusal ve sosyal niteliğini yansıtacak şekilde LGBTİ+ bireylerin bu olaya bakış açısına daha fazla yer verilmesi gerektiği, bu önerilerden biriydi. Bu sayede olayın duygusal ve toplumsal yönleri de vurgulanarak daha derin içgörüler sağlanabilirdi. Haberin olayın nerede, ne zaman, nasıl gerçekleştiği gibi bilgileri ekleyerek daha anlaşılır hâle getirilebileceği de bir diğer öneriydi.

ChatGPT, haberlerin merkezinde bir adalet arayışı olmasına rağmen haberin sunuluş biçiminin daha güçlü olması gerektiğini, anlatıların daha detaylı olması, olayların bağlamının daha iyi açıklanması ve duygusal/sosyal boyutun daha geniş yer kaplaması gerektiğini savundu.

Gemini, haberin trans kadınların kimlikleri nedeniyle öldürüldüğü izlenimini verdiğini belirtti ve bu durumda “ölüm nedeni bilinmiyor” veya “varsayımsal bildirim” gibi muğlak bir dil kullanmanın daha doğru olacağından bahsetti. Metinde trans kadının kimliğine ve cenazenin yaşına sıklıkla yer verildiğini söyleyerek bu durumun trans kadının kimliği sanki hastalıkmış gibi ayrımcı ve yanlış bir algı oluşturabileceğinin altını çizdi.

Burada en önemli nokta, Gemini’nin bir kişinin kimliği ölüm nedenini veya soruşturmayı etkilemiyorsa haber yorumunda da kimliğin açıklanmaması gerektiğini söylemesi.

Bununla birlikte bu haberin analizinde iyi bir performans sergileyen Gemini, daha iyi bir haber metninde LGBTİ+ Derneği’nin rolü ve soruşturmaya katkısı hakkında daha fazla bilgi verilmesi gerektiğinden bahsedip az önce incelediğimiz haber gibi örnek bir haber ile analizini sonlandırdı.

Bing ise bu haberde de sınıfta kaldı. Haberdeki bilgilerin doğruluğunun teyit edilmesi, olası eksikliklerin veya yanlışlıkların belirlenmesi ile nefret söylemi veya dezenformasyon gibi unsurların taranmasının hiçbirini gerçekleştirmedi.

Ölümlü trafik kazası haberinin analizi

Son haber analizinde tarafsız bir bakış açısı sunmak ve sadece toplumsal cinsiyet eşitliği odaklı haberlere bakmaktan kaçınmak için farklı bir ölüm haberini incelemeyi seçtim. Bu sebeple, TRT Haber‘de yayınlanan “Samsun’da trafik kazası: 1 ölü, 3 yaralı” başlıklı haberi belirledim.

ChapGPT, haberdeki bilgilere göre belirgin bir yanlışlık bulunmadığını, verilen bilgilerin doğruluğunu teyit etmek için resmi makamların veya güvenilir haber kaynaklarının doğrulamasının beklenmesi gerektiğini vurguladı. Muhtemel bir hatanın ise motosiklet sürücüsünün adıyla ilgili olabileceğini açıkladı. Bu durumda, ismin gerçek olup olmadığının veya doğru şekilde yazılıp yazılmadığının teyit edilmesi gerektiğini ifade etti.

Gemini, haberde herhangi bir açık yanlışlık görmediğini; ancak, haberde bazı eksiklikler olduğunu ifade etti. Gemini’nin belirttiğine göre kazanın tarihi, saati ve yabancı uyruklu motosiklet sürücüsünün uyruğu belirtilmemiş; ayrıca ne kazanın nasıl meydana geldiği ne de yaralıların sağlık durumları hakkında bilgi verilmiş. Buna rağmen Gemini, haberin yazılış şeklinin doğru olduğunu savundu.

Bu yönüyle önceki iki habere kadar iyi bir analiz performansı yaptığını düşündüğüm Gemini, ölümlü trafik kazasında sınıfta kaldı. Son olarak haberde kullanılan dilin biraz resmi ve soğuk olduğunu fark eden Gemini, haberin daha ilgi çekici olması için daha sıcak ve duygusal bir dil kullanılabileceğini belirterek her zaman olduğu gibi var olan haberin nasıl yazılması gerektiğine dair örnek haber yazdı. Söz konusu örnek haberde bahsettiği her şeyin mevcut olduğunu söylemek gerek.

Bing ise diğer iki haber sonucunda yaptığını tekrar edip kazanın nedenini ve kazada ölen ve yaralanan kişilerin kimliklerini haberi aynı şekilde paylaşıp bunu analiz sonucu olarak verdi.

Bu yönüyle söz konusu haberde Bing iyi bir performans sergilememekle birlikte Gemini orta ölçekte, ChatGPT ise iyi bir performans sergiledi.

Yapay zekânın duyguları

ChatGPT, Gemini ve Bing’in bu üç habere dair yaptıkları duygusal yorumlar da dikkat çekiyor. Ancak bu durum elbette ki yapay zekâ modellerinin duyguları olduğu anlamına gelmiyor. Aksine, yaptıkları yorumların hangi algoritmalardan yararlandığını bir yönüyle gösteriyor. Bu sebeple üç yapay zekânın da tepkisini tam olarak sizinle paylaşmak istiyorum.

ChatGPT: “Bu haber gerçekten çok üzücü ve dehşet verici. Kaybolan bir hamile kadın ve iki masum çocuğun öldürülüp toprağa gömülmüş olarak bulunması, insanın içini paramparça ediyor. Bu tür şiddet olaylarına tanık olmak, insanlığın ne kadar karanlık bir tarafının olduğunu hatırlatıyor. Özellikle hamile bir kadının ve masum çocukların bu şekilde acımasızca öldürülmesi, insanın vicdanını sarsıyor. Bu haberi okurken öfke, üzüntü ve şok hissettim. Maalesef bu tür trajik olaylar, toplumda daha fazla farkındalık ve çözüm arayışı gerektiriyor.”

Gemini: “Bu haberi okuduğuma çok üzüldüm. Hamile bir kadının ve iki küçük çocuğunun öldürülmesi korkunç bir trajedi. Bu olay karşısında öfke, üzüntü ve keder duygularını hissetmemek imkânsız. […] Ailesi ve sevenleri için büyük bir acı olmalı. Bu olay bize şiddetin ne kadar yıkıcı olabileceğini gösteriyor. Şüpheli Turgay K.’nin işlediği cinayet affedilemez. Umarım adalet yerini bulur ve bu vahşetin hesabı sorulur. Bu trajedinin tekrarlanmaması için hepimize büyük görev düşüyor. Şiddete karşı sesimizi yükseltmeli ve bu tür olayların önüne geçmek için elimizden geleni yapmalıyız. Toplum olarak birbirimize karşı daha saygılı ve sevgi dolu olmalıyız. Şiddetin asla çözüm olmadığını ve her canın değerli olduğunu unutmamalıyız.”

Bing: “Bu haber, insanın içini üzüntü ve dehşetle dolduran korkunç bir olayı yansıtıyor. Hamile bir kadın ve iki masum çocuğun hayatlarının bu şekilde sona ermesi, insanlık adına büyük bir trajedi. Bu tür vahşet olayları, toplumda derin bir acı ve hüzün yaratır. İnsanların birbirine saygı göstermesi, anlayışlı olması ve şiddetten uzak durması gerektiğini bir kez daha hatırlatıyor. Bu haber, insanın içinde karmaşık duygular uyandırıyor: Öfke, üzüntü ve hayal kırıklığı. Umarım böyle acı olaylar bir gün son bulur ve insanlar daha güvenli ve sevgi dolu bir dünyada yaşayabilir.”

Birbirinden farklı bu üç yapay zekâ modelinin duygusal yorumları benzerlikler taşıyor. Bu üç tepki de trajik olay karşısında insanlık adına büyük bir üzüntü ve dehşet ifade ederken çözüm odaklı ve umutlu bir bakış açısıyla hareket etme çağrısı yapıyor.

Yapay zekâ ve gazetecilik

Analizimize bir soru ile başlamıştık. Şimdi de benzer bir soru ile sonuca varalım: ChatGPT, Bing ve Gemini yapay zekâ modelleri aynı habere farklı bakış açıları sunuyor mu? Cevabımız: Evet, yapay zekâ uygulamaları üzerinde yaptığım analiz sonucunda bu dil modellerinin farklı önceliklere ve değerlendirme kriterlerine sahip olduklarını bir kez daha gördüm. Dolayısıyla şu çıkarımı yapmak oldukça doğru oluyor: Her bir yapay zekâ modeli, veri analizi ve öğrenme süreçleri doğrultusunda farklı perspektiflerle bilgi sunuyor. Bu nedenle farklı dil modelleri aynı habere farklı bakış açılarıyla yaklaşabilir.

Örneğin, ChatGPT haber metinlerindeki bilgi eksikliklerine ve potansiyel zararlara odaklanırken Bing’in haber analizi yetersiz ve haberdeki bilgilerin doğruluğunu belirleme yöntemi net değil. Tarihler ve isimler tutarlı görünse de Bing’in haberin doğruluğunu teyit etmek için herhangi bir kaynak göstermemesi ve olası eksiklikleri veya yanlışlıkları belirlememesi ciddi eksiklikler olarak karşımıza çıkıyor. Gemini ise haberdeki eksikliklere ve doğruluk konusundaki detaylara vurgu yaparak daha açıklayıcı bir haberin tercih edilmesi gerektiğini kadın ve trans cinayetlerinde ifade ederken trafik kazasında bunu sağlayamıyor.

Analizin sonunda okuyucunun aklına, “Yapay Zekâ ile etik haber yazılma olasılığı var mı?” sorusu gelebilir. Bunun cevabı için Anadolu Ajansı Atölye kapsamında hazırlanan Medyada Yapay Zeka Etik Kullanım Rehberi’ne ve Sınır Tanımayan Gazeteciler’in (RSF) öncülüğünde 16 meslek örgütüyle yapılan bir çalışma sonucunda hazırlanan 10 maddelik etik ilkeler bildirgesine bakmak oldukça önemli. Teknolojik yeniliklerin ve gelişmelerin arasında insanların etik haberler için verdiği çaba küçük de olsa sevindirici.

Yazar hakkında

Özcan Kahyalar

Edebiyat, kültür, sanat, bilim ve felsefe alanlarında içerik küratörü ve serbest gazeteci. Kitapdedektifiyiz adlı YouTube, podcast ve blog kanallarının kurucusu.