Newsletter

Nauka i technologie

Badanie: ile zasobów polskiego internetu z lat 90. utraciliśmy?

25.02.2021, 08:00aktualizacja: 25.02.2021, 08:00

Pobierz materiał i Publikuj za darmo

Tylko 22 proc. polskich adresów URL skatalogowanych w przewodniku z 1997 r. jest jeszcze dostępnych. A prawie 80 proc. zasobów przetrwało jako kopie w archiwach Webu - wynikło z badań Marcina Wilkowskiego z Centrum Kompetencji Cyfrowych UW.

Marcin Wilkowski z UW, doktorant Instytutu Badań Literackich PAN, zbadał stan zachowania zasobów polskiego internetu z 1997 roku. Przeanalizował 951 adresów URL, skatalogowanych i opisanych w wydanym w 1997 roku, drukowanym przewodniku "Polish World" autorstwa Martina Miszczaka.

"Współcześnie dostępnych jest jedynie niecałe 22 proc. z nich. W archiwach Webu istnieją kopie prawie 80 proc. badanych linków, przy czym ani współczesna dostępność, ani obecność w archiwum Webu nie gwarantuje, że możemy korzystać z oryginalnej postaci strony WWW z początków 1997 roku"- podsumowuje Wilkowski w przesłanym PAP komunikacie o swoich badaniach.

Wyniki jego pracy ukazały się w czasopiśmie naukowym "Archiwa - Kancelarie - Zbiory".

Wilkowski tłumaczy, że badania historycznego Webu z wykorzystaniem drukowanych przewodników z lat 90. były już podejmowane, przy czym jest to pierwsze takie badanie dla polskiej domeny krajowej.

"Ponieważ nie możemy skorzystać z indeksu wszystkich stron WWW dostępnych w określonym czasie, chcąc sprawdzić, ile z nich wciąż jest dostępnych, musimy szukać innych źródeł informacji. Obok drukowanych katalogów i przewodników są nimi katalogi internetowe, popularne przed tym, jak Google zdominowało sposób wyszukiwania w Internecie, czasopisma, w których publikowano recenzje stron WWW czy artykuły naukowe, gdzie linki do zasobów internetowych umieszczano w przypisach" - zwraca uwagę Marcin Wilkowski.

Badacze dawnego internetu korzystać mogą niekiedy z indeksów i zasobów archiwów Webu, serwisów na bieżąco gromadzących kopie stron WWW i agregujących dane na ich temat. Archiwa takie powstają od połowy lat 90. - największe z nich tworzone jest przez amerykańską fundację Internet Archive, chociaż większość z nich prowadzona jest przez biblioteki i archiwa narodowe.

"W Polsce takie archiwum nie funkcjonuje, chociaż podejmowano próby jego zainicjowania - badacze polskiej domeny krajowej muszą więc korzystać z zasobów Internet Archive, chociaż archiwum to zabezpiecza zasoby internetowe bez wyraźnego planu, dość przypadkowo, często także na żądanie użytkowników - każdy może zgłosić tam link do zabezpieczenia" - tłumaczy autor badań.

Badanie stron WWW skatalogowanych w "Polish World" to próba rozpoznania wielkości straty związanej z niedostępnością i zmiennością zasobów polskiej domeny krajowej.

W ocenie Wilkowskiego stabilność zasobów WWW jest kluczowa, choćby w badaniach i komunikacji naukowej czy polityce informacyjnej instytucji rządowych. "Niska współczesna dostępność polskich stron z połowy lat 90. nie jest wyjątkiem wobec dostępności zasobów z innych domen - wyjątkowa jest sytuacja, w której osoby zainteresowane korzystaniem z polskich zasobów z przeszłości nie mogą skorzystać z polskiego archiwum, profesjonalnie gromadzącego i udostępniającego kopie stron. Dbałość o stabilność i zachowanie domeny krajowej może być uznane za część suwerenności technologicznej. Jest to szczególnie ważne współcześnie, wobec sytuacji, w której media społecznościowe współtworzą debatę publiczną, a instytucje państwa, kultury i nauki masowo korzystają z nich informując o swoich działaniach i komentując bieżące wydarzenia" - zwraca uwagę autor.

Źródło informacji: Nauka w Polsce

Pobierz materiał i Publikuj za darmo

bezpośredni link do materiału
Data publikacji 25.02.2021, 08:00
Źródło informacji Nauka w Polsce
Zastrzeżenie Za materiał opublikowany w serwisie PAP MediaRoom odpowiedzialność ponosi – z zastrzeżeniem postanowień art. 42 ust. 2 ustawy prawo prasowe – jego nadawca, wskazany każdorazowo jako „źródło informacji”. Informacje podpisane źródłem „PAP MediaRoom” są opracowywane przez dziennikarzy PAP we współpracy z firmami lub instytucjami – w ramach umów na obsługę medialną. Wszystkie materiały opublikowane w serwisie PAP MediaRoom mogą być bezpłatnie wykorzystywane przez media.

Newsletter

Newsletter portalu PAP MediaRoom to przesyłane do odbiorców raz dziennie zestawienie informacji prasowych, komunikatów instytucji oraz artykułów dziennikarskich, które zostały opublikowane na portalu danego dnia.

ZAPISZ SIĘ