Tabula, Manuel Aristarán, Jeremy Merrill ve Mike Tigas tarafından PDF’lerden tablo verilerini ayıklamak için yaratılan bir araç. Bu yazı ise Tabula’yı kullanmak için basit bir rehber.
Tabula’yı indirin
Kullanmaya başlamak için, Tabula’yı buradan indirin.
Tabula’yı dışarı aktarın ve yerel ağda açın
Tabula’yı dışa aktarın ve programı açın. Ardından tarayıcınızda localhost:8000‘e gidin. Şunu göreceksiniz:
PDF’i yükleyin
Browse (gözat) düğmesini tıklayın ve dışarı aktarmak istediğiniz tabloları içeren bir PDF yükleyin. Daha sonra Import‘a (içe aktar) tıklayın.
Tabula’nın PDF’lerinizi okuyabilmesi için içlerine gömülmüş metin olması gerekir. Görsel temelli PDF’ler Tabula tarafından okunamaz ve “Üzgünüz, PDF dosyanız görsel temelli” mesajıyla karşılaşırsınız.
Tabloları vurgulayın
Autodetect Tables (tabloları otomatik algıla) tuşuna tıklayın, böylece Tabula yüklediğiniz PDF içindeki tabloya dayalı veriyi bulmaya çalışır. Dışarı aktarmak istediğiniz tabloyu vurgulamadıysa, ekran görüntüsünü alıyormuşsunuz gibi kendiniz vurgulayın. Seçiminizden X tuşuyla vazgeçebilir ve yeniden seçebilirsiniz. Sınırları dahil tüm tabloyu vurguladığınızdan emin olun.
Verinizi dışa aktarın
İkinci seferde tabloyu vurgularken daha dikkatli olduk.
Verinizi kontrol edin
Orijinal PDF ile tablonuzun Tabula önizlemesini iki kez kontrol edin. Karşılaştırmak için Preview veya Adobe Acrobat gibi başka bir program kullandık. Böylece hiçbir verinin kaybolmadığından ya da yanlış okunmadığından emin olursunuz.
Tablonuzu dışa aktarın
Verilerinizi iki kez kontrol ettikten sonra, Tabula tablonuzu çeşitli biçimlerde dışa aktarabilir.
Biz tablomuzu CSV formatında dışarı akardık ve manipüle etmeye devam edebilmek için herhangi bir e-tablo programında açabildik. Teşekkürler Tabula!
Bu içerik ilk olarak storybench.org‘da yayınlanmıştır.