NLTR Research Hub tarafından hazırlanan bu podcastte, Sadettin Demirel ile Reddit’te Haber Paylaşım ve Tüketim Pratikleri Üzerine Keşifsel Bir Analiz başlıklı araştırma raporu üzerine konuştuk.
Sadettin Demirel, Üsküdar Üniversitesi İletişim Fakültesi’nde doktor öğretim üyesi. Yeni medya, metin madenciliği, duygu analizi veri gazeteciliği gibi alanlarda çalışma yürütüyor. Sosyal medya ve sosyal ağlardaki topluluklar, tartışmalar ve dinamikler ise Demirel’in uzmanlık alanı. Aynı zamanda İstanbul merkezli Veri Okuryazarlığı Derneği’nin kurucu üyesi, hâlihazırda ise başkanı. Sadettin Demirel, akademide ve STK alanında faaliyetlerine devam ediyor.
Reddit’in ne olduğunu ya da nasıl kullanıldığını bilmeyenler olabilir. Reddit nedir, neden bu kadar kullanılıyor?
Reddit bir sosyal ağ platformu, ancak forum tabanlı bir platform. Platform, belli başlı kanallardan ve topluluklardan oluşuyor. Bunlardan birisi, raporda incelenen r/Turkey topluluğu. Bu topluluklar, Reddit içerisinde ayrı derebeylikler gibi işliyorlar. Gönüllü olarak moderatörlük yapan sayfa yöneticileri var, grupların içinde o gruplara has sosyal dinamikler ve kurallar var. Siyaset, oyun, ekonomi, kodlama, programlama gibi birçok konuda topluluklar mevcut. Dolayısıyla Reddit’i ucu bucağı olmayan bir platform olarak düşünebiliriz.
Reddit’te kullanıcılar anonim olarak kendi kullanıcı hesaplarını oluşturuyor, kendi fikirlerini paylaşıyor, tartışmalara katılıyor. Bu anlamda platform, dijital kamusal alan olarak da işlev görüyor olsa da diğer sosyal platformlar, örneğin Instagram ya da Facebook gibi çalışmıyor. Burada tamamen kullanıcıların doğrudan enformasyonla, eğlenceyle, kendi içerikleriyle bir nevi kendilerinin ürettiği, kendilerinin paylaştığı farklı topluluklar görüyoruz. Ek olarak, platformun kendi dinamikleri var. Bunlar “upvoting” ve “downvoting”, aslında beğenmek ve beğenmemek. Bu oyların sonucunda kullanıcılar “Karma” adı verilen dinamikle derecelendiriliyor. Eğer karmanız düşükse belli kanallarda paylaşım yapamıyorsunuz. Yani aslında biraz sosyal, kültürel sermaye gibi çalışıyor denilebilir.
Platformun demografik yapısına baktığımızda ise erkekler çoğunlukta. Batı Avrupa ve Kuzey Amerika ülkelerinde ise Reddit daha yaygın kullanılıyor. Ülkemizde de yavaş yavaş kullanım sıklığının arttığını görüyoruz.
Raporda en çok erişim elde eden 2 bin 185 gönderiyi incelemişsiniz. Bunları duygu ve içerik analizi olarak ikiye ayırıyorsunuz. Ayrıca duygu analizini yaparken ChatGPT’nin GPT 4o modelini kullanmış, daha sonra bu analizi manuel olarak da tekrarlayıp aradaki uyum oranının yaklaşık yüzde 80 çıktığını yazmışsınız. Yapay zekânın kimileri tarafından ürkütücü de görülen bu gelişimi hakkında görüşleriniz neler?
Genel olarak, yapay zekânın hâlihazırda birçok sektörde sıklıkla kullanıldığını görüyoruz. Dolayısıyla hem sektörel hem de bireysel çalışmalara entegre edilmiş durumda. İleride bu entegrasyon daha da ilerleyecektir. Yapay zekâ modellerinin, kendi ihtiyaçlarımıza göre ürettiğimiz asistanlar olarak kullanabileceğimiz bir hâle geleceğini düşünüyorum. Bu boyutuyla kullanımını sıklıkla gördüğümüz yapay zekâ, akademik alanda da sıklıkla kullanılacaktır. Çünkü bu teknoloji ilerledikçe, yoğun işgücü gerektiren çelik analizi, metin analizi, duygu analizi gibi tekniklerin yavaş yavaş yapay zekâyla daha çok yapıldığını göreceğiz ki yapılmaya da başladı bile. Bunun bir örneği de bu rapor. Yapay zekânın sahip olduğu ümit verici performansın ileride daha da gelişeceğini ve belirli bir noktada tüm iş akışlarımıza entegre edileceğini öngörüyorum.
Bunun dışında, bu meseleyi daha iyimser ya da daha kötümser yönden ele alan kişiler, gruplar ve topluluklar var. Bence iki uca da gitmemek gerekiyor. Onun yerine belirli tehlikeleri ve dezavantajları fark edebileceğimiz kadar yapay zekâ okuryazarlığına sahip olmamız gerekiyor.
Raporun çıktılarına gelirsek, nötr bir dille yazılan başlıkların ya da gönderilerin olumlu ya da olumsuz uçta konumlandırılanlardan daha az upvote edildiğini görüyoruz. Başlığın nasıl yazıldığı ve nasıl bir dil kullanıldığı, içeriğin kendisinden daha öncelikli olabiliyor. Bunun sebebi ne olabilir? Bu konuda ne düşünüyorsunuz?
Manşetten ya da gönderinin anlamından çıkardığımız şey polariteyi belirliyor. Bahsedilen olumsuz bir konuysa, örneğin savaştan bahsediliyorsa, yapay zekâ bu gönderiyi doğrudan olumsuz olarak etiketliyor zaten. Yapay zekâ kullanmayıp sözlük tabanlı duygu analizi yapsak da, oradaki kelimelerden veya olumsuz ifadelerden bu çıkarılacaktır. Olumlu ve olumsuzların etkileşimlerine baktığımızda, uç kutuplarda konumlanan gönderilerin daha çok etkileşim aldıklarını görüyoruz. Kutuplaştırılmış söylemlere daha çok çekilmemizin bunun sebebi olduğunu düşünüyorum.
Tabii birçok başka nedenden de bahsedebiliriz. Sadece polariteyle alakası olmayabilir. Bunun içerik dağıtım sistemiyle ya da algoritmayla da ilgisi olabilir. Örneğin, belli bir algoritma, olumlu ya da olumsuz içerikleri diğer kullanıcıların önüne koyuyor olabilir.
Reddit kullanıcılarının çoğunluğu erkek. Peki bu durum siyaset ya da suç temalarındaki gönderilerin daha fazla olumlu oy olması ile ilişkili olabilir mi?
Reddit kitlesi, biraz niş bir kitle. Türkiye toplumunu tam olarak temsil ettiği söylenemez. Dolayısıyla, toplum içinde kadınların zaman içinde politikaya katılım oranlarının arttığını görsek de bu durum Reddit’e yansımamış olabilir. Ancak raporda da belirtildiği gibi, 2016 ile 2023 arasında kadın kullanıcı oranında bir artış gözlemleniyor. Bu da olumlu bir olgu.
Ek olarak, raporda ele aldığımız, sadece r/Turkey topluluğu. Başka ülkelerin de içerik paylaştıkları, aynı zamanda farklı konularda içerik üreten topluluklar var. Örneğin, moda üzerine kurulmuş bir toplulukta kadınlar daha ağırlıklı olabilir. Yani cinsiyet dağılımı biraz toplulukların içeriğiyle de bağlantılı.
Politik içeriklerin daha çok upvote edilmesi, Türkiye ile de alakalı olabilir. Çünkü siyaset neredeyse hayatın her alanına sirayet etmiş durumda. Herhangi bir faaliyette konu hemen politik tartışmalara gelebiliyor. Dolayısıyla, siyaset paylaşılması da bu anlamda normal.
Raporda, n-gram tekniğinden bahsediyorsunuz ve bu tekniği kullanıyorsunuz. Bu teknik analiz sürecinde ne işe yarıyor, ne gibi kolaylıkları var ve nasıl kullanıyorsunuz?
Bu teknik, metin analizinde metindeki ardışık kelime veya karakter gruplarını incelerken sıkça kullanılıyor. Yapılan işlem, tüm metin bloğunda ardışık olarak sıklıkla kullanılan kelimeleri tespit etmek. Burada unigram tek bir kelimeyi ifade ediyorken; bigram iki kelime, trigram ise üç kelimeden oluşan ifadeleri içeriyor. Unigram yerine bigram dediğimiz ifadeler, daha bağlamsal ifadeler. Çünkü bir kelime birçok yerde kullanılabilse de iki kelime ardışık olarak bir araya sıklıkla geliyorsa size bir bağlam verebiliyor. Dolayısıyla bu yöntem, büyük metinleri anlamlandırmak için kullanılıyor, birçok doğal dil işleme alanında da kullanılıyor.
Raporunuzda, Reddit’te haber odaklı yapılan paylaşımların yalnızca bir kısmında doğrudan kaynak olduğunu gösteriyorsunuz. Herhangi bir gazeteci, haberi yakalamak istediğinde yanlış ya da hiç olmayan bir bilgiyle karşılaştığında bu durum hem gazetecileri hem de Reddit kullanıcılarını nasıl etkiler? Dezenformasyonun önemli bir tartışma başlığı olduğu günümüzde bu, dezenformasyonla mücadele açısından bir tehdit midir?
Topluluk içinde kaynak kullanılarak verilen haberlerin oranının yüzde sekiz olduğunu bulguladım. Çoğunlukla kaynak kullanılmaması, dezenformasyon ve bilgi düzensizliği ortaya çıkarabilecek bir tehdit aslında. Tehlikeli veya yanlış bilgi dağılımının bu gibi topluluklarda potansiyel olarak var olduğunu görüyoruz. Ayrıca bu gönderiler sadece Reddit’te değil, Google aramalarında da görülüyor.
Raporda, haber olarak etiketlenmiş gönderilere baktığımızda, kaynak olarak daha çok Twitter’da korsan habercilik yapan hesaplar dikkat çekiyor. Bunlar da aslında tehdit oluşturuyor çünkü bu korsan habercilik hesapları, habercilik etiğine uygun hareket etmiyorlar. Bir haber merkezi olmamalarına rağmen paylaşımları yüksek sayıda etkileşim de alıyor.
Bu topluluğu modere eden kişilerin, kullanıcıların hangi haber kaynaklarına referans verebileceklerine ya da haber kaynaklarını nasıl kullanabileceklerine dair bir topluluk kuralı eklemeleri yararlı olabilir. r/Turkey için de bu önlem uygulanabilir.
Kullanıcıların aktif bir şekilde katıldığı bir topluluk, riskleri barındırdığı kadar gazeteciler için fırsatlar da yaratabiliyor. Gazeteciler burada kendi haberlerini paylaşabilir, topluluğun kendisini haber yapabilir veya haberlerini topluluk içerisinden oluşturabilir. Ne şekilde kullanılırsa kullanılsın Reddit, merkezi olmayan ve kullanıcı odaklı yapısından dolayı dezenformasyon pratiklerine açık. Bunu unutmamamız gerekiyor.
Bir diğer tehdit ise toplulukların yankı odası oluşturma ihtimali. Çünkü bu topluluklar genellikle belirli görüşleri yansıtan gruplardan oluşuyor. Bu grupların dışında düşüncelere sahip kullanıcılar, diğer kullanıcılar tarafından downvote edilerek topluluğun dışına çıkarılabilirler. Bu noktada, moderatörlere de iş düşüyor.
Araştırma raporu hakkında daha fazla bilgi almak, öğrenmek ve Research Hub’ın diğer araştırmalarına erişmek isterseniz Research Hub sayfasını ziyaret edebilirsiniz.