Autor Wątek: Trwałość dokumentów cyfrowych  (Przeczytany 7219 razy)

0 użytkowników i 1 Gość przegląda ten wątek.

Offline Grzegorz Gałęzowski

  • archiwista
  • ***
  • Wiadomości: 444
  • Płeć: Mężczyzna
Trwałość dokumentów cyfrowych
« dnia: Wrzesień 13, 2009, »
Mam przyjemność zaprezentować fragment informacji, jakie zaprezentowałem w kwietniu podczas swojego zebrania naukowego w Archiwum Państwowym w Lublinie.


































Dla chętnych, którzy chcieli by się pobawić dekodowaniem zapisów cyfrowych polecam, stronę:
http://home2.paulschou.net/tools/xlate



Umieszczony został tam funkcjonalny translator binarny, pozwalający na tłumaczenie we wszystkich kierunkach
w formatach: tekstowym (ASCII), binarnym (Binary), szesnastkowym (HEX), kodowanie transportowe (BASE64), dziesiętne (DEC/CHAR)
i na koniec sumy kontrolne (MESSAGE DIGEST/CHECK SUM)
« Ostatnia zmiana: Wrzesień 13, 2009, wysłana przez Grzegorz Gałęzowski »

Offline Kazimierz Schmidt

  • młodszy(a) archiwista(ka)
  • *
  • Wiadomości: 146
Trwałość NOŚNIKÓW dokumentów cyfrowych
« Odpowiedź #1 dnia: Wrzesień 14, 2009, »
I znów wracamy do podstawowego dylematu dyskutowanego także na naszym forum zob. np. http://www.ifar.nac.gov.pl/index.php?topic=77
http://www.ifar.nac.gov.pl/index.php?topic=174
http://www.ifar.nac.gov.pl/index.php?topic=619


To wszystko prawda co Pan przytacza w referacie, ale z wnioskami zupełnie się nie zgadzam tak jak i z tytułem pracy (i wątku na forum).

Często stosowanym "chwytem" jest zarzucanie cyfrowym nośnikom nietrwałości i wysnuwanie z tego wniosku o nietrwałości dokumentów elektronicznych. A następnie  wyciąganie wniosków, że należy z dystansem podchodzić do rewolucji cyfrowej. Otóż dokument elektroniczny to nie jest nośnik zapisany danymi, tylko DANE zapisane na nośniku (proszę porównać definicję legalną). I te DANE potrzebujemy trwale przechować, a nie ten nośnik.
Wiadomo od dawna, że nośniki informatyczne są nietrwałe i być może ten kto wymyśli trwały i pojemny nośnik dostanie nobla. Wiadomo od dawna, że w przypadku informatycznych nośników danych  (a także nośników do elektronicznego zapisu analogowego) najlepszym sposobem konserwacji jest przenoszenie danych na nowe nośniki. Że próba utrzymania "oryginału" może okazać się najlepszą drogą do utraty danych.
Wiedza ta została przeniesiona do najróżniejszych wytycznych, stworzonych przez poważne zespoły międzynarodowe, dotyczących długotrwałego przechowywania dokumentów elektronicznych (nie: nośników). Znajdziemy ją także w przepisach prawa wymagających przenoszenia danych na nowe nośniki w przypadku zagrożenia utratą danych (w tym polskich też). Znajdziemy w lokalnych politykach bezpieczeństwa teleinformatycznego... Zresztą sam Pan o tym pisze.

Dlaczego więc w konkluzjach pisze pan że "dane z nośników cyfrowych mogą stracić czytelność w ciągu jednego dziesięciolecia" a także że "należy z dystansem traktować cyfrowych rewolucjonistów"? Dane z nośników cyfrowych nie stracą na czytelności jeśli je na czas przeniesiemy na inne nośniki.
Poza tym cyfrowi rewolucjoniści zrobili swoje i dokument elektroniczny JUŻ jest faktem (choćby to forum) - nie wracajmy więc do dyskusji jakież to cyfrowe może być niebezpieczne dla pamięci narodów. Zastanówmy się raczej jakie jeszcze działania (oprócz wpisania dokumentu elektronicznego do ustawy archiwalnej, przygotowania rozporządzeń, powołania NAC, powołania NINA, tworzenia sieci bibliotek cyfrowych, przystąpienia do TEL i Europeany, itd.) trzeba podjąć.

Aha: niech Pan "dołoży" do kopii referatu także fragment ze spisem wykorzystanych weń źródeł To ważne.
Kazimierz Schmidt

Offline Grzegorz Gałęzowski

  • archiwista
  • ***
  • Wiadomości: 444
  • Płeć: Mężczyzna
Odp: Trwałość NOŚNIKÓW dokumentów cyfrowych
« Odpowiedź #2 dnia: Wrzesień 14, 2009, »
Niepotrzebnie nawiązał Pan głównie do samego starzenia się nośników. Dla mnie najważniejsze jest starzenie się systemów kodowania informacji.
Szczególnie jeżeli dotyczy to formatów zamkniętych. Sam ostatnio miałem problem z odczytaniem plików dźwiękowych stworzonych pod koniec lat 80.
Całość była nagrana na jakimś egzotycznym programie na 16 bitowym Atari ST.
Nigdzie teraz nie mogę znaleźć programu za pomocą, którego można byłoby to odczytać.
Już parę razy miałem także do czynienia z problemem odczytania plików tekstowych
utworzonych w programach, których obecnie nie można zdobyć.
Co najgorsze żadne współczesne programy nie radzą sobie z ich odczytaniem.
Aby odczytać dokumenty z kiedyś popularnego TAG'a, trzeba dysponować konwerterem TAG2ASC, którego oczywiście legalnie nie można zdobyć.
Problem dotyczący tego programu nie jest jeszcze jakoś mocno skomplikowany.
Wszystko pięknie, jeżeli przegrywa się dane na nowe nośniki i dokonuje się konwersji z formatów zamkniętych na formaty otwarte.
Niestety nie będzie tak pięknie i dane jednak będą znikały.
Niby w jaki sposób ma się odbywać te przegrywanie i konwersja.
Nie sądzę by w naszym kraju jakieś instytucje posiadały odpowiednie środki na taki cel.
Rozumiem jeszcze sytuację, że teraz używamy określonego nośnika na archiwizację i gdy się zestarzeje to przegrywamy go po paru latach na nowy
(chociaż wątpię by coś takiego miało miejsce w naszych warunkach, będzie zawsze brakowało pieniędzy).
Co zrobić jak już ma się te ?starożytne? dane i nie ma czym ich odczytać (brak oprogramowania lub odpowiedniego czytnika nośników)?
Coś takiego już się często teraz dzieje. Pozostaje zapisywać dane w "czystej" binarnej formie nie skarżonej nadmiarowością.
Najprostszy do odszyfrowania byłby tutaj czysty 8-bitowy tekst. Niestety raczej odpada ze względu na swoją prostotę.
W sumie najtrwalszym obecnie nośnikiem danych jest DNA (w 1962 roku przyznano za odkrycie tego nośnika Nobla),
które jak napisałem jest już wykorzystywane do zapisywania informacji, szkoda tylko że nie komercyjnie.
Niewiele osób wie że jest opracowany nośnik wykorzystujący siły atomowe, który przynajmniej teoretycznie ma być odczytany
bez problemu po 3 tysiącach lat i przy okazji potrafi zmieścić 1TB (to było dostępne już na początku lat 90).
Wykorzystano w nim specjalne stopy metalu, a zapis dokonywany jest za pomocą ostrza AFM atom po atomie.
Wychodzi się z założenia że opracowanie w dalekiej przyszłości czytnika wykorzystującego siły atomowe będzie dużo prostsze niż odtworzenie magnetofonu czy odtwarzacza CD.
Jednak jeszcze raz powtórzę, nośniki nie są najważniejsze, ale strumienie bitowe.
Interpretacja strumienia bitów jest niemożliwa bez dodatkowych informacji kontekstowych.
Sposób kodowania musi być jak najbardziej prosty. Wynika stąd potrzeba przyjęcia standardów kodowania
informacji opisowych; wystarczy prosty system obejmujący wyłącznie dane tekstowe.
Każde przenoszenie informacji na nowy nośnik powinno iść w parze z tłumaczeniem informacji opisowych.
Napisał Pan że nie potrzebne są emulatory, to w jaki sposób odczytać te informacje,
które nie zostały z różnych powodów przeniesione lub nie można ich przenieść? Emulatory będą potrzebne i to nie tylko do muzeów. 
Tego samego wniosku jest UE tworząca KEEP - Keeping Emulation Enviroments Portable, jak i firmy typu IBM.

Polecam dodatkowo zapoznać się z poniższym newsem:

http://news.bbc.co.uk/2/hi/technology/6265976.stm

Mimo tego że jestem informatykiem, to nie mogę się zgodzić że dokumenty elektroniczne są trwałe.
Nawet jeżeli wyodrębni się je spoza formy materialnej jaką są nośniki.
Niestety naiwnością byłoby oczekiwać, że określony system kodowania, nawet taki, który teraz wydaje się nam jako zupełnie naturalny, wytrzyma próbę czasu.
Informatycy ciągle opracowują nowe schematy zapisu danych, oznaczające często konieczność rezygnacji z dotychczasowych metod.
Jedyne co pozostaje to przynajmniej próbować przegrywać ciągle na nowe nośniki i nowe formaty.
Nasuwa się porównanie z przepisywaniem praktykowanym kiedyś w celu zachowania tradycyjnego tekstu.
Takie przepisywanie musi następować, zanim dokument przestanie być czytelny wskutek fizycznego
zniszczenia lub przestarzałości technicznej. Najmniejsza przerwa w łańcuchu będzie oznaczać utratę informacji.
Tylko jak podczas tego kopiowania interpretować strumienie bitowe bez znajomości formatu zapisu?

Offline Kazimierz Schmidt

  • młodszy(a) archiwista(ka)
  • *
  • Wiadomości: 146
Odp: Trwałość dokumentów cyfrowych
« Odpowiedź #3 dnia: Wrzesień 15, 2009, »
Odniosłem wrażenie, że to Pan poświęcił referat głównie historii nośników - stąd moje główne nawiązanie do tego że nośnik nie jest przeszkodą gdyż jest tylko tymczasowym miejscem przechowywania danych. Ileż razy zmieniły się nośniki IFAR-a i czy nam to w jakiś sposób przeszkadza?
Przenoszone na czas dane spokojnie dadzą się odczytać. Problemem może być to, że nie dadzą się one zinterpretować. To starzeją się technologie, a nie dane. Czy z takim stwierdzeniem możemy się zgodzić?
Kamień z Rosetty to dobry przykład danych które daje się odczytać ale nie daje się zinterpretować. Dla zdecydowanej większości współczesnych nie daje się odczytać rękopisów łacińskich. Ale są tacy co umieją i potrafią przetłumaczyć na język współczesny.
Informacja o współpracy TNA i Microsoftu idzie właśnie w tym kierunku tj. stworzenia podstaw to tego aby był ktoś kto będzie umiał "przetłumaczyć" stare dane na dane zrozumiałe dla współczesnego oprogramowania. Informacja ta obiegła świat już dawno temu i została odnotowana na naszym forum przez kocibrzucha:
http://www.ifar.nac.gov.pl/index.php?topic=567.msg4360#msg4360 i dalej w tym wątku jeszcze dwa linki.
Oczywiście media rządzą się swoimi prawami i aby lepiej sprzedać newsa odnotowały że "informatyzacja to katastrofa". Tylko gdyby nie ta katastrofa to nie porozumiewalibyśmy się teraz w ten sposób, nie moglibyśmy nawiązać do newsa sprzed 2 lat w sposób umożliwiający natychmiastowe zapoznanie się z jego treścią. Zapewne nie powstałby Pana referat który stał się przyczynkiem do tej dyskusji (źródła!). Ale i czy z tego wszystkiego wynika że "należy z dystansem traktować cyfrowych rewolucjonistów"?
Aby było jasne: zebrał Pan w jednym miejscu sporo informacji o sposobach zapisu danych cyfrowych i problemach z ich utrzymaniem i interpretacją. To cenny materiał i moje "czepianie się" dotyczy tylko wniosków podsumowujących.
Stwierdza Pan w kolejnym poście, że
Cytuj
wszystko pięknie, jeżeli przegrywa się dane na nowe nośniki i dokonuje się konwersji z formatów zamkniętych na formaty otwarte. Niestety nie będzie tak pięknie i dane jednak będą znikały. Niby w jaki sposób ma się odbywać te przegrywanie i konwersja
Odpowiadam: oczywiście że część danych będzie znikała. To zupełnie naturalne i szat bym z tego powodu nie rozdzierał. To samo dzieje się w świecie analogowym. Przegrywanie i konwersja (które jak się zgodziliśmy muszą być realizowane i wtedy wszystko pięknie) będzie się odbywało w sposób ... odpowiedni do zastosowanej technologii. Innej technologii bowiem trzeba będzie do przegrywania materiałów filmowych a innej do dokumentacji elektronicznej odzwierciadlającej sposób załatwiania spraw w urzędzie. Będzie, bo nie ma innego wyjścia. Kwestionowanie informatyzacji nic nie da. Materiały filmowe nie będą tworzone wyłącznie w technologii 35mm, a akta wyłącznie na bezkwasowym papierze.  Były już nawet propozycje aby "najważniejsze" teksty elektroniczne mikrofilmować w celu ich wieczystego utrwalenia i nawet sporo takich rozwiązań się sprzedało. Abstrahując od sensu takich rozwiązań trzeba wyraźnie powiedzieć, że mają one bardzo mały zasięg.
Kazimierz Schmidt