Dünyanın verisini depolayan dijital istifçiler: Terabaytlarımız insanlığın refahı için!

Bugünlerde bilgi dediğimiz şey hiç olmadığı kadar kısa ömürlü. Stephen Hawking’in ölmeden kısa bir süre önce ortaya attığı ‘bilginin asla tam olarak yok edilemeyeceğine’ ilişkin teorisine rağmen, bilgi arkasında hiçbir iz bırakmadan ortadan kaybolabiliyor.

Üstelik bu sadece analog veriler için de geçerli değil. Kitapların baskılarının tükenebileceği gibi, web siteleri de bir dolu bilgi, fikir ve gerçeklerle birlikte kaybolup gidebiliyor. Özellikle de şarkılara, haberlere ya da kısa videolara tek bir tıkla güncelleme yapabildiğimiz şu dönemde, bu malzemelerin güncellemeden önceki hallerine dair tek bir iz bile kalmaması çok olası bir durum. Bunların yok olmaması birilerinin arşiv yapmasından geçiyor.

Onlardan biri 19 yaşındaki Peter Hanrahan. Hanrahan, zamanının önemli bir kısmını 1960’lardan liste başı şarkılar çalan radyo programlarına harcıyor. İngiltere’nin kuzeyinde yaşayan öğrenci Hanrahan’ı bunu yapmaya iten şey 2019 yapımı Tarantino imzalı ‘Bir Zamanlar Hollywood’da’ filmini izlemesi olmuş. Genç adam, filmin ardından 1964 ile 2006 yılları arasında devam eden İngiliz müzik programı Top of the Pops bölümlerini toplamaya başlamış.

Hanrahan, arstechnica.com’a yaptığı açıklamada “YouTube, BBC iPlayer veya diğer radyo programlarında ciddi bir eksiklik olduğunu tespit ettiğim için Top of the Pops bölümlerini araştırıyordum. Fakat daha sonra Bir Zamanlar Hollywood’da filminde radyonun o dönemdeki önemini fark edince bunu deneyimlemek istedim. O dönemin müziğini keşfetmenin bir baş yolu da buydu.“

Facebook’un sizi stalk’laması için Facebook kullanıcısı olmanıza gerek yok

İlk durak Youtube, olmazsa archive.org, son çare Reddit…

Aslında Hanrahan sadece 60’ların İngiliz liste başı şarkılarını deneyimlemek isteseydi elbette Spotify’a başvurabilirdi. Ancak, canlı stüdyo konukları, dudak senkronizasyonu tartışmaları ve iddia edilen seks suçluları da dahil olmak üzere o günlerde kayıt altına alındığı şekliyle TV’yi deneyimlemek istiyordu.

Doğal olarak, YouTube’da birçok eski bölüm bulunuyor. Ancak BBC, örneğin Jimmy Savile veya Gary Glitter’ı içeren bazı bölümleri kaldırmayı denemiş. Ayrıca YouTube da ‘yayından kaldır’ ihbarlarına çok hızlı bir şekilde yanıt verebiliyor ve bugün yayında olan bir video ertesi gün yayından kaldırılmış olabiliyor.

Hanrahan’ın bir sonraki durağı ise 411 milyar web sayfası, 23 milyon kitap, 5.5 milyon film ve çok sayıda başka verilerle dolu kar amacı gütmeyen bir kütüphane olan archive.org oluyor. Hanrahan, ihtiyaç duyduğu şeylere çoğu zaman buradan ulaşsa da ulaşamaması durumunda illa bir yerlerde biri tarafından kaydedilmesi yüksek ihtimal olan Reddit de üçüncü bir seçenek olarak dikkat çekiyor.

Ulaşmak istediği verileri elde etmesi Hanrahan’a oldukça uzun vakitlere mal olsa da sonunda işe yarıyor. Bu işteki birinci yılının sonunda kendisini ‘istifçi’ olarak tanıtan Hanrahan şimdiye kadar 1 terabyte’tan daha fazla veri toplamış durumda.

Hanrahan bu konuda tabii ki de tek değil. Dijital istifçiler dünya genelinde önemli bir sayıya ulaşmış durumda. Reddit’teki veri istifçilerinin sayısı 2020 itibariyle 200 bin civarında. Buradaki topluluğun amacı veri toplamak, görüntü almak, kaydetmek ve gelecekte okunması için koruma altına almak. Genellikle bu bilgileri fiziksel ortamda veya kişisel sabit diskler ve depolama aracılığıyla çevrimiçi ve çevrimdışı olarak saklama amacı güdülür. Reddit’teki DataHoarder’ı (Veri istifçileri) binlerce gelişigüzel bireysel İnternet Arşivi gibi düşünebiliriz. Her ne kadar her bir üyenin özel ilgi alanları olsa da….

Estonya siber krize ‘bulut’ ile hazırlanıyor

Hong Kong’daki demokrasi hareketine dair atılan her tweet kayıt altında

Datahoarder’da, YouTube videolarından oyun yükleme disklerine kadar her şey hakkında veri depolayan kişiler bulunmakta. Bir kişi, ülke tarihinin en kötü yangınını yaşayan Avustralya merkezli tüm web sitelerini kopyalamayı dahi planlamış. Daha sonra bu post, Avustralya web sitelerinin fiziksel sunucularının ülke dışında bulunduğu ortaya çıktıktan sonra silindi. Şimdilik güvendeler.

Bazı kullanıcılar ise ziyaret ettikleri veya kullandıkları her web sitesini arşivlemekte ve koleksiyonlarında  neredeyse her şeyi bulmak mümkün: Filmler, müzik ve porno bunlar arasında en popülerleri.

Geleceğin tarihçileri için, Hong Kong’daki demokrasi hareketine dair atılan her bir tweet, yapılan her canlı yayın ve TV programı, birkaç özel kullanıcı tarafından zulalanmış durumda. Hong Kong protestoları üzerine Sosyoloji yüksek lisans tezi için araştırma materyali arayan bir akademisyenin DataHoarder’ı ziyaret etmesi, istifçiliğin yararlı olduğunu kanıtlıyor.

İstifçilerin genel olarak amacı gelecek nesiller için bilgi birikimi yapmak gibi görünse de, arşivlenen bilgiler istifçilerin ilgi alanlarına göre şekil değiştiriyor. Windows 98 cihazları için kişiselleştirme sunan web sitelerinin ve orijinal imleçleri gösteren web siteleri arşivlerini bile bulmanız mümkün. Yelpaze, belirli bir zaman diliminde tek bir ülkenin internetini muhafaza eden istifçilerden Japonya’nın hava durumu tahminlerini ya da sessiz filmleri arşivleyen kullanıcılara kadar oldukça geniş.

Datahoarder ilk olarak bir IRC sohbet kanalı olarak başladı. Nihayetinde, topluluk arada sırada kullanılmakta olan r / datahoarder’lara geçti ve r / datahoarder dört yıl önce ortaya çıktı. Ayrıca, üyelerin koleksiyonlarındaki eksiklerini tamamlamaya çalıştıkları ayrı bir exchange subreddit’i de (r / DHExchange) bulunmakta.

Şimdilerde bu ağın sohbet konuları oldukça teknik ve büyük ölçüde üyelerin topladıkları çok miktarda verilerinin verimli bir şekilde saklanması veya istiflenmesine yönelik olarak için kullanılmakta. Kullanıcılar, yüzlerce terabaytta çalışan sabit disk dizileri, buluttaki yığın depolama seçenekleri ve yayınlar, müzik, dergiler ve web sayfaları gibi arşivlenmezse unutulacak olan eski medya araçlarını arşivlemeye ilişkin oldukça şaşırtıcı olan maliyetler hakkında tavsiye almak istiyorlar.

Siber Bülten abone listesine kaydolmak için formu doldurunuz

Leave a Reply

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

*

This site uses Akismet to reduce spam. Learn how your comment data is processed.