Google News Lab’in 2017 yılı Veri Gazeteciliği raporuna göre günümüzde veri haberciliğinin haber merkezlerine entegrasyonunun önündeki en önemli engellerden birisi gazetecilerin yeterli veri becerisine sahip olmaması ve mevcut veri analiz ve görselleştirme araçlarının yetersizliği veya çalışma akışında birden çok araca mahkum olmaları. Peki bu güçlüklerin üstesinden gelinmesinde R (istatistik dili veya programlama dili olarak da bilinen yazılım) ne derece faydalı olabilir? R ile üretilen veri gazeteciliği örnekleri nelerdir? R öğrenmeye nereden başlamalı?
R istatistik dili veya programlama dili olarak bilinen ücretsiz ve açık kaynak bir yazılım. R ile herhangi bir web sitesini kazıyabilir, elde ettiğiniz veriyi temizleyip, manipüle edip görselleştirebilirsiniz. R ile yapılabilecekler bunlarla sınırlı değil, bugün makine öğrenmesinden tutun, metin madenciliğine ve duygu analizine, interaktif web uygulamalarına (shiny.io) kadar geniş yelpazede kullanılan bir araç. Fakat bunları yapabilmek için R platformunun kendine özgü kodlama dilini de öğrenmek gerekiyor. CRAN, R Arşiv Ağı’na yüklenen paketler aracılığıyla çalışan yazılımın kendine ait bir uygulaması da olmasına rağmen genelde R studio, Microsoft R Open gibi entegre programlar tercih ediliyor. Bu programlar aracılığıyla hem R’ı öğrenmek daha kolay hâle geliyor hem de daha fazla işleve kolay bir şekilde ulaşılabiliyor.
R veri gazeteciliği süreçlerinde nasıl kullanılıyor?
R, verinin elde edilmesinden sunumuna geniş yelpazede imkânlar sunuyor ve veriyle çalışan bir gazeteci için vazgeçilmez bir araç. Sadece bir kaç satır kodla çalışma akışınızı hızlandırabilir, gereksiz üçüncü parti araçlardan kurtulabilirsiniz.
ABD merkezli FiveThirtyEight R yazılımını en iyi şekilde kullanan haber merkezlerinin başında geliyor. FiveThirtyEight’de çalışan veri gazetecisi Andre Flowers, R yazılımını veri gazeteciliğinin her adımında kullandıklarını, veriyi işlemekten, temizlemeye, veri analizinden, çalışmanın interaktif olarak sunumuna kadar R’dan yararlandıklarını ifade ediyor. FiveThirtyEight bununla da yetinmiyor haberlerinde kullandığı verileri bir paket hâlinde R ortamına ve Github sayfasına ekliyor. Bu sayede hem verinin yeniden kullanılmasını teşvik ediyor hem de yaptıkları işleri açık ve şeffaf bir şekilde sergilemiş oluyorlar. Peki neler üretiyorlar:
UBER Manhattan’daki Taksicileri Nasıl Etkiledi
Bu arada FiveThirthyEight’in 2016 yılı Veri Gazeteciliği Ödüllerinde yılın en iyi veri gazeteciliği sitesi ve en iyi veri uygulaması ödülünü de aldığını ekleyelim. FiveThirthyEight’in yanı sıra Propublica, Financial Times, Buzzfeed, ABD Ulusal Halk Radyosu (NPR), İsviçre merkezleri SRF haber merkezi, Alman haber merkezi Spiegel Online gibi bir çok haber merkezi R yazılımını veri gazeteciliği çalışma akışında kullanıyor. Bunların yanı sıra ödül almış veya almamış veri gazeteciliği veya araştırmacı gazetecilik projeleri de R yazılımından doğrudan veya dolaylı olarak yararlanıyor. Bu saydığım haber merkezlerinden bazıları ayrı bir veri ekibine sahipken bazıları ise R kullanma becerisine sahip veri gazetecisi istihdam ediyor.
R’ın kullanıldığı örnek bir diğer çalışma: Buzzfeed veri muhabiri Peter Aldhous, ABD sağlık sistemini konu aldığı haberinde ggplot2 ve gganimate paketlerini kullanarak animasyon bir veri görselleştirme üretmiş. Ayrıca Peter Aldhous R kullandığı bir diğer haberi Göklerdeki Casuslar ile 2016 yılı En İyi Veri Görselleştirme ödülüne layık görüldü.
Bir diğer güncel örnek 2018 yılı En iyi Veri Gazeteciliği Portfolyosu ödülünü alan Spiegel Online muhabiri Patrick Stotz. Stotz çalışmalarında ağırlıkla tidyverse paketini kullandığını ve veri kazıma, temizleme ve başlangıç analizlerini R ile yaptığını vurguluyor.
R öğrenmeye nereden başlamalı?
Bir kaç satır kod ile yukarıdaki çalışmaları hayata geçirmek, veri gazeteciliği süreçlerinde zamandan ve bütçeden tasarruf etmek hayal değil ama R programlama dilini öğrenmek zahmetli bir iş. Hem zaman hem de çaba gerektirse de imkânsız değil. R yazılımı web ortamında canlı bir topluluğa sahip. Github, Stack overflow, Rbloggers gibi yardımlaşmaya açık forum tarzı siteler sıkıştığınızda yardım isteyebileceğiniz veya probleminize sorun bulabileceğiniz alanlar sunuyor. Bunun yanı sıra ücretsiz açık erişime sahip e-kitaplar, çevrimiçi eğitimler de cabası.
R öğrenmeye 2017 yılında başlamış biri olarak kişisel tecrübemi paylaşmam gerekirse, R programlama dilini öğrenmenin, bir dil öğrenmekten farkı yok. Sadece alıcının R yazılımı, bağlamın bilgisayar ortamı ve dilin ise formüle edilmiş kodlardan oluştuğu bir platform. Bu dili öğrenmek için envai çeşit ücretsiz ve ücretli kaynak ve sorularınıza cevap verecek yardımsever bir topluluk mevcut. Peki nereden başlamalı:
Swirl
SwiRl, R paketlerinden farklı olarak R ve R studio gibi uygulamaları interaktif bir öğrenim platformu hâline getiriyor. Sadece paketi yazılıma yükleyerek, soru cevap şeklinde ilerleyen bir eğitim modülüne yönlendiriliyorsunuz. Belirli komutlar yardımıyla kullanıcı adı ile giriş yapıp, R programlamaya giriş, veri görselleştirme, veri temizleme gibi derslerden kolaylıkla yararlanabilirsiniz.
SwiRl’de henüz Türkçe bir derse denk gelmedim ama belki ilerde Türkçe veri gazeteciliği dersleri ve alıştırmalarıyla önemli bir öğrenme platformu hâline gelebilir.
Datacamp
Datacamp, ücretli bir çevrim içi öğrenme platformu fakat ücretsiz R programlaya giriş dersleri mevcut. Belirli sayıdaki modüller ücretsiz. Video destekli alıştırmalarla verimli bir öğrenme deneyimi sunuyor. Yıllık üyeliği pahalı olmasına rağmen, belirli haftalarda indirimlerden yararlanabilirsiniz.
Diğer çevrimiçi eğitimler ve kaynaklar
- Akademisyen Emre Toros tarafından hazırlanmış ücretsiz Türkçe R Kitabı. Kitap sosyla bilimciler için yazılmış olsa da R öğrenmeye yeni başlayanlar için önemli bir kaynak.
- Veri bilimci David Robinson tarafından oluşturulan çevrimiçi ücretsiz R veri analizi ve görselleştirme eğitimi.
- Texas Üniversitesi ve Knight’ın birlikte yürüttüğü “Gazeteciler için R Programlamaya Giriş” dersi https://journalismcourses.org/course/view.php?id=9, şu da ders için oluşturulmuş e-kitap: https://learn.r-journalism.com/en/
- R ile veri gazeteciliği yapmak isteyenler için oluşturulmuş rehber tarzında bir kaynak https://rddj.info
- R öğrenmeye yeni başlayanlar için bir kılavuz niteliğinde ücretsiz e-kitap http://r4ds.had.co.nz/index.html
- Metin analizi ve duygu analiziyle ilgilenenler için faydalı bir e-kitap: https://www.tidytextmining.com