Metinden sese: Gelecek robot spikerlerin mi?

Geçtiğimiz günlerde karşımıza çıkan bir haber, spikerlik/sunuculuk mesleğinin geleceğine ilişkin önemli tartışmaların arifesinde olduğumuzun göstergesi niteliğindeydi. Haber, Çin’in resmi haber ajansı Şinhua’nın, teknoloji devi Sogou ile birlikte bir “yapay zekâ spikeri” geliştirdiğini belirtiyordu.

Gerçek bir spiker model alınarak geliştirilen “robot”, sistemine yüklenen metni, vurguları, mimikleri aktaramasa da gayet sorunsuz okuyordu. Hatta hemen sonrasında model alınan spiker ile robotun videoları yan yana getirilerek hangisinin gerçek olduğu üzerine internetin olağan tartışmalarından biri bile yaşandı.

İşin magazinel boyutu bir yana, bu yazıda haber spikerliği mesleğinin geleceğinin, mevcut teknoloji ile nasıl değişeceğine ilişkin bazı noktaları ele alırken, robot spiker teknolojisinde kullanılan yazılı metni sesli hâle döndürme programları hakkında bazı bilgiler aktarmaya çalışacağım.

Gazetecilik üzerine yapılan tartışmalarda ekran yüzlerinin işlevi çoğu zaman es geçiliyor. Bazen spiker gazeteci midir tartışması yapılıyor ve bu konuda hâlâ net bir uzlaşıya varılmış değil. Neticede bugün geldiğimiz noktada spikerlik mesleğinin televizyon gazeteciliğinde en azından Türkiye genelinde çok da değerinin olmadığı bir aşamaya gelindiğini söylemek mümkün.

Robot spiker nasıl çalışıyor?

Bir spikerin veya yayıncının yerine robot spikerler geçebilir mi? Bu konuyu ilerleyen dönemde sıkça tartışacağa benziyoruz. Önümüzdeki örneği ele alalım. Şinhua’nın spikeri metni kusursuz bir dil ile okuyor. Yapay zekâya kelimeleri tanımladığınızda ve dili öğrettiğinizde ona aktardığınız bir yazıyı, dilediğiniz hızda seslendirebileceği aşikâr. Aslında bu teknoloji günümüzde gazetecilerin zaman zaman kullandığı bir özelliğe farklı bir açıdan yaklaşım. Bugün mobil cihazlarda, konuşmaları metne döndürmek hayatımıza hızla yerleşen bir özellik. Speechnotes, Voice Notes gibi uygulamalar bir basın toplantısını bile not hâline dönüştürebilecek yeteneğe sahip, buna ek olarak günlük mesajlaşma programlarında kullandığımız klavyeler de dikte özelliği ile neredeyse kusursuza yakın bir hızla konuşmalarınızı metne dökebiliyor. Bu sadece hızlıca, editoryal bir gözden geçirme ile teyit edilebilecek bir yöntem olarak günlük hayatımızda yer alıyor. Ekrandaki spikerin yaptığı ise, günlük pratikte çok kullanmasak da yazılı metni sese dönüştürme özelliği. Bu, aslında Google Translate veya Microsoft Office programlarının bile yaptığı bir özelliğin bir robota aktarılmasından ibaret. Neticede robot haber spikerinin yaptığı bu hizmetlerin günümüz teknolojisi ile bir uygulaması.

Yazıdan sese metin aktarımı

Robot spikerin yaptığı ise bir algoritma kullanmanın da gerisinde bir metnin diktesi modeline dayanıyor. Yani spikerliğin de üstünde yazılı bir metni sesli hâle çevirmekten bahsediyorum. Aslında bu konuda Türkiye olarak biraz geride kalsak da Dünya genelinde dijital habercilik ortamında benzer örneklere rastlamak mümkün. Her zaman haberi okumaya vaktimizin olmadığı bir ortamda bunun kullanıcılar için büyük kolaylık sağlayacağı, hatta görme engelli okurların ve ikinci bir dil öğrenmek isteyen kişilerin de sitelerden alacağı verimi artıracağı da kolay tahmin edilebilen bir durum. Teknoloji bir metni sesli okutma konusunda bugüne kadar aslında tembel bir tablo çizdi ve birçok noktada ilerleme sağlanırken bu alan biraz daha kısır kaldı. Bu konuda yaygın kullanılan örneklerden biri Readspeaker. Sistem 35 farklı dilde 70 ayrı ses ile haber metinlerini ses olarak kullanıcıyla buluşturuyor. Yazılım Corriere della Sera, De Telegraaf, MarketWatch, Financial Times Deutschland, Dagens Nyheter gibi haber sitelerine entegre kullanılabiliyor. Programın çeşitli versiyonları var ve istediğiniz pakete göre çeşitli fiyatlandırma seçenekleri sunuyor. Web sitesine konan bir play düğmesi ile sitenizdeki haberleri sesli olarak bu program ile kullanıcılarınıza aktarabiliyorsunuz. Çoğu haber sitesinin altyapısını kuran WordPress’te ise Responsive Voice eklentisi öne çıkıyor. 51 dilde 168 ses ile gelen eklentinin ücretsiz sürümü tüm özelliklerini sunmasa da iş görebilecek kapasitede. Yıllık alındığında aylık 39 dolar gibi yüksek bir ücret ile geliyor. Ama bundan daha uygun fiyatlı, pratik ve kullanıcı odaklı çözümlerin de işlerinizi kolaylaştırabileceğini belirtmekte fayda var. Alman asıllı Linguatec firmasının sunmuş olduğu Voice Reader Home 15, her türlü metni sesli hâlde kullanıcısına aktarabilen bir modele sahip. Çevrim dışı modda Word, Pdf gibi dosyaları okuyabilen bu program, içinde Türkçe’nin de olduğu 45 dili 67 ses tipi ile destekliyor. Programın en büyük avantajı farklı formatlardaki içerikleri tam performans ile destekliyor olması. Fiyatı ise 49 Euro seviyesinde. Capti Voice ise başka bir işlevli uygulama. Yıllık 17.99 dolar gibi uygun fiyatlı bir sistem ile gelen yazılım bulut sistemdeki metinlere ulaşım, yeni kelimeler öğrenebilme gibi özellikleri ile dikkat çekiyor. Daha çok eğitim sistemlerinde kullanılmak üzere kurulan Capti Voice, Gutenberg ya da Bookshare gibi platformlarda bulunan kitapları da okuyabilme özelliğine sahip. Capti Voice’un biraz daha kısıtlı özelliklere sahip ücretsiz bir versiyonu da bulunuyor. Bu yazılımın büyük avantajlarından birisi ise tarayıcı üstünden light bir sürümünün de kullanılarak istediğiniz metni içine aktarabileceğiniz bir altyapı sunması. Instapaper ya da benzeri paylaşım ortamlarına destek de bir diğer artısı. Programın Türkçe desteği olduğunu da hatırlatmakta fayda var. Bulut odaklı bir yazıdan seslendirme yapan yazılım aradığınızda ise karşınıza NaturalReader Online çıkıyor. Daha çok kişisel kullanım üstüne odaklanan program 9 ayrı dil seçeneği ile kullanıcıya 57 premium ses sunuyor. Türkçe desteği olmayan yazılım neredeyse tüm dosyalara destek veren bir seçeneğe sahip. Program aylık 9.99 ya da yıllık 4.99 dolarlık seçenekleri ile satışa sunulurken, ücretsiz sürümünün de kısıtlı özellikler ile geldiğini belirtebiliriz.

Mobil ve tarayıcılarda durum nasıl?

Mobil cephesine baktığımızda ise Voice Dream Reader çoklu dil desteği ile dikkati çeken bir yapım. Pocket, Instapaper, Evernote gibi uygulamalara verdiği destek önemli bir artı. Türkiye’de 29.99 TL’lik bir fiyat ile Google platformunda yer alan program, Apple’da ise 99.99 TL’lik fiyatı ile satışa sunulmuş. Bu konudaki en umut vadeden yazılım ise Amazon’un Polly’si gibi duruyor. Polly’nin en büyük iddiası okuduğu metinleri tekdüze bir formatta değil tonlamaları ile seslendirmek. “Deep learning” ile sürekli tekniğini geliştiren Amazon 47 ayrı dilde metni seslendirme imkânı sunuyor. Fiyatlandırma modeli ise kullandıkça öde metoduna dayanıyor. Ancak Türkiye desteği ilk aşamada çok da yeterli bir tablo çizmiyor. Türkiye menşeli yazılımlara bakıldığında ise Sestek ve benzeri çeşitli uygulamalar da mevcut. AT&T, CereProc, DIOTEK, IVONA, Neospeech, SYNVO, YAKiToMe!, Yandex ve CPqD da bu konuda çalışmalar yürüten diğer firmalar. Tarayıcı uzantısı olan uygulamalarda ise Select and Speak, Chrome’da öne çıkan uygulamalardan. Günlük 5.000 kelime sesli okuma özelliği var. Ful sürümü ise aylık 2.99 dolar. Bu uygulamanın da Türkçe desteği mevcut ancak tonlama ve tempolarda çok zayıf olduğunu belirtmek gerek. Firefox’ta ise Text to Speech uygulaması Chrome’dakilere kıyasla bir adım daha ilerde gibi duruyor. Ancak en başında söylediğim gibi kelimeleri seslendirme konusunda yeterli adım atılmamış durumda. Bu sistemlerin Türkiye haber sahasındaki uygulamasını ise http://kur.doviz.com sitesinde bulmak mümkün. Sayfayı açtığınızda başlayan otomatik video günlük haberleri sesli biçimde okuyabiliyor. Şinhua’nın haber spikeri de bu model üstüne kurulu bir denklem ile kullanıcıya sunuluyor.

Robotlar neleri değiştirecek?

Yazının bu bölümünde çok küçük bir parantez açarak robotların, yapay zekânın ve algoritmanın habercilik içindeki yerine değinmek gerektiğini düşünüyorum. 2006 yılında Reuters’in finans haberleri için algoritmaları kullanacağını açıklaması ile başlayan süreç 2014 yılında Los Angeles Times’ın deprem haberini otomatik olarak yazdırması ile çok ileri bir noktaya geldi. Bugün dünyanın en büyük medya kuruluşları, haberlerini yazarken algoritmalardan, yapay zekâdan fazlasıyla faydalanıyor. Haber doğrulama, istatistik verileri ve benzeri tablolarda büyük bir iş yükünü çözümlüyor. Özellikle bu konunun nasıl bir aşamaya geldiğini anlamak için Bilge Narin’in “Uzman Görüşleri Bağlamında Haber Üretiminde Otomatikleşme: Robot Gazetecilik” makalesinin çok daha geniş açıdan bu konuyu ele aldığını hatırlatmak ve meraklısına da tavsiye etmek isterim.

Tekrar robot haber spikerine dönmek gerekirse bugün sadece yazılı bir metni okuma yetisine sahip olan okuyucunun ilerde neler yapabileceğini hayal etmek zor değil. Örneğin, spikerliğin metni ekrandan okuma kısmını normal bir spikere göre çok daha iyi yapma ihtimali çok yüksek. Bütün gün haber okuduğunuzda, belli bir yoğunluk ve yorgunluktan sonra zaman zaman dil sürçmeleri yaşanması robot spiker ile tamamen ortadan kalkacaktır. Metni okurken spiker hiçbir koşulda takılmayacağı gibi ona yazılım olarak tanımlandığı ölçüde kusursuz bir dil ile bu okumayı gerçekleştirebilir. Algoritmalar sayesinde haber okudukça ve hafızasında tanımlandıkça daha kusursuz haber okuma sistemine evrilecek. Bir son dakika olduğunda, spiker internetten, bilgi birikiminden ve benzeri ögelerden faydalanarak olayların arka planını özetleyebilir ve izleyicilere bir perspektif sunabilir. Ancak yapay zekânın hazırladığı spiker, olayı siz tanımlarsanız ilk çağdan bugüne özetleyerek gerçek bir bilgi kütlesi aktarabilir. Bütün bu açılardan ele alındığında yapay zekânın işleteceği haber spikeri, yeryüzündeki en iyi spikerden daha iyi bir performans ortaya koyabilir. Hele ki bu spikerin 24 saat boyunca hiç yorulmadan ekranda durabileceğini hesaba kattığımızda işler günümüz spikerleri için daha da zorlaşacaktır.

Emeğin robotlaştığı bir süreçten gazeteciliğin etkilenmeden çıkması imkânsız. Robotlar mesleğimizi yaparken şüphesiz bizim için büyük bir artı sağlayacak. Ancak analiz yeteneğinin olmaması robotların varlığını gazeteciler için çok avantajlı bir konuma çeviriyor. Gazetecilik mesleğinin gücünü kaybettiğini düşündüğümüz bu süreçte robotların sürece dahil olmasını dezavantaj değil avantaja çevirmek de bize düşüyor. Elbette sermaye, “O sizin gibi hasta olmuyor, derdi tasası yok!” diyerek yeri geldiğinde karşıda robotu savunacak. Ancak bu noktada işini iyi yapan, gerçeklere daha fazla odaklanan ve kendini geliştiren gazeteci hayata bakışı ile yine değerli olacaktır. Spiker ve sunucunun yapması gereken ise özgünleşmek. Artık kusursuz dil kullanımı, hata yapmadan okumak ve benzeri yetenekler yeterli değil. Haber odasında yer alan her birimin bundan sonraki süreçte nitelikli bir dayanışma atmosferine girmesi mesleklerin geleceği için büyük önem teşkil ediyor.

Yapay zekâ ile haber sunan spiker bugün 1.0 sürümünde ve güncellemeleri vakit kaybetmeden ile alacağı belli. Yukarıda bahsettiğim metni konuşan uygulamalar gazetecilerin kendilerini geliştirmeleri açısından önem arz ediyor. Çünkü bu uygulamalar çalışmalarda büyük kolaylıklar sağlıyor.

Subscribe
Bildir
guest
0 Yorum
Eskiler
En Yeniler Beğenilenler
Inline Feedbacks
View all comments
İlginizi çekebilir