Coraz powszechniejszy w archiwach państwowych proces digitalizacji zasobu oznacza konieczność stworzenia jednolitego systemu opisu skanów materiałów archiwalnych. Jego szczególnie ważnym elementem jest skonstruowanie przejrzystego modelu nazwy pliku (skanu), uniwersalnego i możliwego do przyjęcia we wszystkich archiwach, uwzględniającego różne metody digitalizacji w nich wdrażane. Propozycję takiego rozwiązania opracowaliśmy w Archiwum Państwowym w Lublinie wspólnie z Rafałem Magrysiem i Markiem Krzykałą. Mieliśmy okazję i przyjemność zaprezentować ją na naradzie zespołu problemowego „Informatyka i Archiwa” w Poznaniu w dniach 21-22 kwietnia 2004 roku. Poniższy tekst uwzględnia uwagi członków tego zespołu, za które serdecznie dziękujemy.
1. Realia i założeniaW archiwach państwowych digitalizacja ograniczona jest zazwyczaj do skanowania fragmentów jednostek archiwalnych w celu realizacji zamówień użytkowników zasobu lub dla własnych potrzeb archiwów (strony www, publikacje itp.). Proponowany system opisu skanów powinien uwzględniać ten stan i ułatwiać poruszanie się wśród takich „fragmentarycznych” zasobów cyfrowych. W szczególności, poprzez możliwość szybkiego dotarcia do informacji, czy jakieś części określonej jednostki archiwalnej zostały już zeskanowane, powinien umożliwiać uniknięcie wielokrotnego skanowania tych samych fragmentów (stron, kart). Powinien również ułatwić wykorzystanie dotychczas wykonanych skanów przy realizacji digitalizacji systemowej, będącej zaplanowanym sprowadzeniem do postaci cyfrowej całych jednostek i zespołów.
Doświadczenia lubelskie skłaniają do przyjęcia reguły, że w przypadku doraźnej potrzeby zeskanowania znacznej części jednostki (np. ponad 50%), należy zeskanować ją w całości. Przemawiają za tym względy organizacyjne i ekonomiczne. O ile tylko jest to możliwe, należy również stosować zasadę „jedna strona – jeden skan”, przy czym standard opisu powinien uwzględniać dotychczasową numerację kart (stron).
2. Cele standaryzacjiProponowany standard opisu powinien umożliwiać:
- ujednolicenie formatu opisu skanów w archiwach państwowych,
- uzyskanie informacji o zeskanowanych jednostkach oraz o tym, co w obrębie jednostki zostało zeskanowane,
- digitalizację „krokową” (tj. skanowanie jednostek we fragmentach i późniejsze ich scalanie),
- „kompatybilność” z międzynarodowymi standardami opisu archiwalnego, bazami danych oraz środkami ewidencyjnymi (np. ISAD, SEZAM, IZA)
- możliwość łatwego wyszukiwania poszczególnych jednostek i ich fragmentów.
Umożliwi to budowę ogólnopolskiego systemu informacji o zdigitalizowanym zasobie, a jeśli okaże się to celowe – utworzenie wspólnej biblioteki zeskanowanych materiałów na centralnym serwerze. System taki może być podstawą do budowy bazy danych uwzględniającej informacje o jednostce archiwalnej (a nie o pliku) – ale naszym zdaniem sama nazwa pliku nie powinna tych informacji zawierać. W proponowanej postaci ma on przede wszystkim umożliwiać odpowiedź, czy konkretny fragment konkretnej jednostki został już zeskanowany. Standard nie musi informować o technicznych parametrach skanu, dacie jego wykonania autorze itp. – mogą być one bowiem generowane automatycznie. Naszym założeniem było użycie w proponowanym systemie elementów głównie numerycznych, co ułatwi w przyszłości budowę systemów wyszukiwawczych.
3. Propozycja formatu opisuProponowany przez nas format opisu składa się z 8 elementów, w tym tylko jednego literowego. Są to:
- kod literowy kraju (w przypadku archiwów polskich – PL),
- numer archiwum (zgodny z bazą SEZAM),
- numer zespołu,
- ciąg dalszy numeru zespołu,
- sygnatura jednostki,
- numer karty (strony),
- cyfrowy symbol recto (1) / verso (2) – lub 0 w przypadku, gdy poprzedni element jest numerem strony, a nie karty,
- numer kolejny skanu (może się zdarzyć, że konkretna karta (strona) jednostki będzie posiadać kilka skanów, np. związanych z dokumentowaniem prac konserwatorskich czy stanowiących zbliżenia fragmentów strony – pieczęci, inicjałów itp.).
4. Przykład opisuPrzykładowy opis dla skanu z jednostki (dane z bazy SEZAM) 35/322/0/9 (Archiwum Państwowe w Lublinie, zespół: Akta Florentyna Jana Górskiego notariusza w Lublinie 1810-1822, sygn. jednostki: 9 [Księga aktów notarialnych nr 1671-1933]), karta 57 v, skan nr 1 – miałby postać:
PL-35-322-0-9-57-2-1Kolejne elementy oznaczają:
PL – kraj,
35 – numer archiwum (Archiwum Państwowe w Lublinie – Centrala)
322 – numer zespołu
0 – ciąg dalszy numeru zespołu
9 – sygnatura jednostki
57 – numer karty
2 – oznaczenie verso
1 – pierwszy skan tej strony.
Proponowany przez nas standard stosujemy w Archiwum Państwowym w Lublinie. Mając świadomość różnorodności doświadczeń z digitalizacją w archiwach państwowych i chcąc je uwzględnić w możliwie najszerszej skali - pragniemy poddać go pod dyskusję na forum IFAR. Będziemy wdzięczni za wszelkie uwagi i komentarze.