The Guardian Veri Ekibi’nden veri gazeteciliği tavsiyeleri

Veri gazeteciliği denince akla yüksek seviye teknik bilgi, sofistike cihaz ve dijital araçlar, çok büyük bütçeler, gazetecilikten ziyade istatistik ve bilgisayar programcılığında uzman “geek” ekipler ve insandan uzak, rakamlara ait bir dünya geliyor çoklukla. Oysa The Guardian Veri Ekibi örneğinin gösterdiği gibi, temel analitik beceriler, basit araçlar, orta uzun vadede sabır ve sebat, ve sahaya inen gazeteciler ile, veriden beslenen ancak insana dokunan, “gerçek gazetecilik” yapmak mümkün.

Bu yazıda The Guardian Veri Ekibi örneğinden yola çıkarak veri gazeteciliğine dair sıkça sorulan soruları cevaplamaya çalışacağız.

Veri gazeteciliği nedir?

Veriden beslenen, yaptığı haberlerde veriden yola çıkan ve haberin omurgası olarak veriyi kullanan gazetecilik türüne veri gazeteciliği diyoruz.

Neden veri gazeteciliği?

Veriye dayanmayan, “konvansiyonel” gazeteciliğe nazaran veri gazeteciliğinin bazı avantajları mevcut:

Ampirik veri sağlar: Anektod ve münferit vakaların tanıklığı kompleks olay ve yapıları açıklamak için yeterli olmayabilir; ispatlanabilir, mukayese edilebilir, sayısal veriler sayesinde olaylar hakkında daha somut analizler yapmak mümkün olabilir.

Büyük resmi görmemize yardımcı olur: Toplumsal trendler, dar bir çerçeveden, spesifik insan hikâyeleri ve tekil vakalar üzerinden okunamayacak kadar karışık ve/veya derine gömülmüş değişimleri, yönelimleri fark etmemizi, görmemizi, anlamamızı sağlar.

Kalitatif veri ile birlikte kullanıldığında ortaya bütünsel bir hikâye çıkar: Veriye dayalı büyük resim analizine eklenecek anekdotlar ve münferit hikâyelere yakından bakış, kompleks vakaları hem yukarıdan geniş ölçekte hem de yakından, detayına inerek algılamamızı sağlar.

The Guardian Veri Ekibi’nin verdiği bir örneği kullanacak olursak, belli bir bölgede liseden atılan öğrencilerin sayısında artış olduğu iddialarını teyit etmek için gerçekten de veriye ulaşmak ve geçmiş yılların verisi ile son yılları mukayese etmek gerekir. Üstelik, demografik verileri incelendiğinde liseden atılan öğrencilerin belli fakir bölgelerde ve fakir ailelerde öbeklendikleri görülüyorsa, bu atılan öğrenciler aslında uyumsuzluk ve kuralsızlıktan ziyade fakir oldukları için atılıyor sonucu çıkarılabilir. Ancak bunu tam olarak, güvenilir ve anlamlı bir şekilde tespit edebilmek için için muhabirlerin olay bölgesine gitmeleri ve ailelerle konuşmaları gerekir ki olayın arka planı anlaşılabilsin ve veri teyit edilebilsin.

Veri gazeteciliğinin zorlukları neler?

Veri gazeteciliği son tahlilde veriye dayanan bir iş olduğundan, veriye erişim, veriyi temizleme ve düzenleme ile ilgili sorunlar doğrudan gazetecilik pratiğini de etkiler. Modern ulus devleti kendinden önceki devlet yapılarından ayıran en önemli özelliklerden biri topluma dair birçok veriyi metodik olarak toplaması ve saklamasıdır. Demografik veriler, sağlık, sahiplik, erişim bilgileri bunlardan bazılarıdır. Dijitalleşen dünya nedeniyle toplanan verinin hacmi daha da artıyor çünkü sadece devlet değil şirketler ve özellikle dijital platformlar da muazzam hacimlerde veri toplamakta. Bu kadar büyük miktarlarda verinin mevcudiyetine rağmen veri dağınık, eksik, manipüle edilmiş veya erişime kapalı olabilir. Veri gazetecisinin görevi bunu açığa çıkarmak, gerektiğinde veriyi birincil kaynaklardan toplamak, veriye dair sorunları tespit etmek, temizlemek ve düzenlemektir.

Bazen veriye erişmek güç olabilir:

Veri yoktur (toplanmamıştır, kaydı tutulmamıştır, engelli veya saklı tutulmaktadır): Toplumda, son yıllarda bir AIDS salgını olduğu algısı yayılmış olabilir. Bununla ilgili bir haber yapmak isteyen veri gazetecisi, HIV test verilerine yetkililerin önceden aldığı karar uyarınca erişemiyor olabilir. Veya bu kayıtlar belki de hiç tutulmamıştır; hatta yapısal güçlükler çeken, çok fakir bir ülkede bu test hiç yapılmıyor, dolayısıyla kaydı da tutulmuyor olabilir. Verinin var olmadığı veya erişimin güç olduğu durumlarda, yeterli kaynak ve zaman mevcutsa gazeteci sahaya inerek veri toplamaya çalışabilir ancak birçok durumda bu çok zor olacaktır. Verinin gizlendiği, erişime açılmadığı durumlarda ise yetkililer ile müzakere ederek veya (yasal ve etik sınırlar içinde kalarak) yan yollardan bu veri elde edilmeye çalışılabilir.

Veri tahrip edilmiş olabilir: Kayıtlar tutulsa da kasıtlı olarak veya sehven yanlış girilmiştir. Bu gibi durumlarda, yanlış veriye dayalı, yanlış bir haber yapmamak için gazetecinin “uyanık olması”, veriyi teyit etmeye çalışması ve hatalar tespit edildikten sonra doğru veriye ulaşmaya çalışması gerekir.

Veri manipüle edilici olabilir: Bazı durumlarda veri ile oynanmamıştır ancak metodoloji yanlıştır ve/veya yanlış yönlendirir. Özellikle ekonomik veriler bu kategoriye girer. Enflasyon verisi Merkez Bankası tarafından, belli bir metoda göre toplanır. Veri gerçekten dikkatle ve hatasız şekilde toplanmış olsa da, metod seviyesinde manipülasyonlar gerçekleşebilir (toplumun genelini ilgilendirmeyen, istisnai ürün ve hizmetlerin enflasyon sepetine gerçekte olması gerekenden daha yüksek önem katsayıları ile eklenmesi gibi). Bu manipülasyonlara karşı veri gazetecisinin, verinin toplanma yöntemi ile beraber metodik mantığı da incelemesi ve eleştirel bir bakışla değerlendirmesi gerekir.

Veri gazeteciliği yaparken dikkat edilecek noktalar neler?

Somut ve net bir amacınız olsun: Ekipteki herkes, bu amacı görünür bir yere yazsın ki bu araştırmayı neden yaptığınızı unutmayın. Araştırma ilk amacınızdan uzaklaşmamalı, bu sebeple odaklanmak çok önemli!

Konuya karar verdikten sonra veriye bakınca gerçekçi olun: Temelsiz, asılsız iddialardan zorla bir hikâye çıkarmaya çalışmayın. Eksik veri ile çalışmayın, ölçeğinizi küçültün ama veriniz olayı gerçekten açıklayacak kadar tam olsun. Hikâyeleri öldürmekten çekinmeyin; olmuyorsa olmuyordur ve zararın neresinden dönülse kârdır.

Veriyi sorguya çekin: Veriye 5N 1K soruları sorun, takip soruları ile derine inin ve verinin verdiği cevapların tutarlılığını kontrol edin.

Değişkenlerinizin net, temiz isimleri olmasına dikkat edin: Ekipteki herkesin aynı şey için aynı ismi kullanması çok önemli. Bunlar, uzun süre sonra baktığınızda da anlamlı olacak isimler olmalı. İsim vermek, tanımlamak ve sınır çekmektir; bu sebeple doğru isimlendirme, doğru tanımlamadır. Detaylara özen gösterin. Büyük-küçük harf, tirenin varlığı veya yokluğu çok önemli sorunlara yol açabilir. Benzer şekilde dosya isimleriniz de temiz ve net olsun: “Veri projesi” şeklinde bir dosya ismi olamaz, birçok veri projesi arasında bu isim hiçbir ayrıştırıcı özelliğe sahip olmayacaktır. Ancak, değişken ve dosya isimlendirirken mevcut isimden daha kısa bir versiyon da temiz ve net anlamı veriyorsa, daha kısa versiyonu tercih edin. Sürekli aynı veriyle çalışacağınız için küçük zaman kazançları uzun vadede birikir ve ciddi zaman tasarrufu sağlar.

Veride ilk bakacağınız şey ortalamalar ve uçlar olmalı: Ortalamalar (ki mean, median, mode farklı şeyler) genel duruma dair bir içgörü sunar ve yapının “normalini” gösterir. Uçlar, ayrıksı duran veriler ise “normalin” dışında kalanları belirtir; asıl hikâye de oradadır. Örnek olarak, Britanya’da son 30 yılın bıçakla öldürme ortalaması aylık 6 iken, geçtiğimiz ay 18 kişi öldüyse burada bir hikâye olması çok muhtemel. Hep belli bir bölgede olan bir şey başka bir bölgede ilk kez oluyorsa; hep belli bir zamanda olan bir şey başka bir zamanda oluyorsa; belli bir ortalama ile gerçekleşen şey bir anda çok artıyor veya azalıyorsa ciddi bir hikâye barındırma potansiyeli mevcut demektir.

The Guardian Veri Ekibi Hangi Araçları Kullanıyor?

Veri görselleştirme: Görselleştirme için Excel ve Google Sheets’in basit görselleştirme araçları kullanılabilir veya Tableau ile çalışılabilir. Asıl görselleştirmeyi görsel ve tasarım (visuals&design) ekibi yapıyor.

Veri çekme ve analiz: Veri çekmek için, platformların yayınladıkları veri setleri, kamuya açık veri setleri veya sahaya inip kendi derledikleri veri setleri kullanılıyor. Bu veriler, Python ve R ile temizlenip analiz ediliyor.

The Guardian Veri Ekibi Kimlerden Oluşuyor?

Genelde düşünülenin aksine, The Guardian Veri Ekibi bilgisayar programcılığı veya istatistik kökenli, erkek mühendislerden oluşmuyor. Kadroda bir sorumlu editör ile üç veri gazetecisi var ve bunların hepsi kadın! Hepsi veriden anlıyor, hepsi kodlama bilgisine sahip; ancak hiçbiri istatistik, veri bilimi veya bilgisayar bilimlerinden gelmiyor; ekipteki üç veri gazetecisinin lisans eğitimleri felsefe, edebiyat ve gazetecilik.

Ekiptekiler kendilerini veriyle çalışmayı bilen gazeteciler olarak görüyorlar; kesinlikle gazetecilere destek olan teknik personeller değiller. Diğer departmanların, gazetecilerin “Excel işlerini” yapmıyorlar. Aksine, The Guardian içinde özel bir araştırmacı gazetecilik ekibi olarak çalışıyorlar. Özgür ve bağımsız karar alma süreçleri var; yaptıkları işlerin %70’i üst editörler tarafından kendilerine veriliyor ancak %30’unu doğrudan ekip olarak kendileri belirliyorlar.


Bu yazı Kasım 2018’de The Guardian Foundation ve NewsLabTurkey’in davetlisi olarak gittiğimiz The Guardian eğitiminin bir çıktısı olarak hazırlanmıştır.

Yazar hakkında

Orhan Şener

Orhan Şener, 1984 yılında Bulgaristan’da doğdu. Lisans eğitimini iktisat alanında tamamladıktan sonra, İngiltere’de City University London’da Enformasyon, İletişim ve Toplum bölümünde yüksek lisansına başladı ve “Üniversite Öğrencilerinin Online Mecralarda Politik Katılımı” başlıklı tezi ile mezun oldu. 2014 yılından bu yana, Galatasaray Üniversitesi Medya ve İletişim Çalışmaları Doktora Programı’nda “Enformasyona Erişim ve Filtreleme Pratikleri: Türkiyeli Gazeteciler Üzerine Çalışma” başlıklı tezini yazmaktadır.