Internetowe Forum Archiwalne > Archiwizacja materiałów cyfrowych i digitalizacja analogowych
Opis skanów materiałów archiwalnych - standard nazw plików
Roman Kusyk:
Coraz powszechniejszy w archiwach państwowych proces digitalizacji zasobu oznacza konieczność stworzenia jednolitego systemu opisu skanów materiałów archiwalnych. Jego szczególnie ważnym elementem jest skonstruowanie przejrzystego modelu nazwy pliku (skanu), uniwersalnego i możliwego do przyjęcia we wszystkich archiwach, uwzględniającego różne metody digitalizacji w nich wdrażane. Propozycję takiego rozwiązania opracowaliśmy w Archiwum Państwowym w Lublinie wspólnie z Rafałem Magrysiem i Markiem Krzykałą. Mieliśmy okazję i przyjemność zaprezentować ją na naradzie zespołu problemowego „Informatyka i Archiwa” w Poznaniu w dniach 21-22 kwietnia 2004 roku. Poniższy tekst uwzględnia uwagi członków tego zespołu, za które serdecznie dziękujemy.
1. Realia i założenia
W archiwach państwowych digitalizacja ograniczona jest zazwyczaj do skanowania fragmentów jednostek archiwalnych w celu realizacji zamówień użytkowników zasobu lub dla własnych potrzeb archiwów (strony www, publikacje itp.). Proponowany system opisu skanów powinien uwzględniać ten stan i ułatwiać poruszanie się wśród takich „fragmentarycznych” zasobów cyfrowych. W szczególności, poprzez możliwość szybkiego dotarcia do informacji, czy jakieś części określonej jednostki archiwalnej zostały już zeskanowane, powinien umożliwiać uniknięcie wielokrotnego skanowania tych samych fragmentów (stron, kart). Powinien również ułatwić wykorzystanie dotychczas wykonanych skanów przy realizacji digitalizacji systemowej, będącej zaplanowanym sprowadzeniem do postaci cyfrowej całych jednostek i zespołów.
Doświadczenia lubelskie skłaniają do przyjęcia reguły, że w przypadku doraźnej potrzeby zeskanowania znacznej części jednostki (np. ponad 50%), należy zeskanować ją w całości. Przemawiają za tym względy organizacyjne i ekonomiczne. O ile tylko jest to możliwe, należy również stosować zasadę „jedna strona – jeden skan”, przy czym standard opisu powinien uwzględniać dotychczasową numerację kart (stron).
2. Cele standaryzacji
Proponowany standard opisu powinien umożliwiać:
- ujednolicenie formatu opisu skanów w archiwach państwowych,
- uzyskanie informacji o zeskanowanych jednostkach oraz o tym, co w obrębie jednostki zostało zeskanowane,
- digitalizację „krokową” (tj. skanowanie jednostek we fragmentach i późniejsze ich scalanie),
- „kompatybilność” z międzynarodowymi standardami opisu archiwalnego, bazami danych oraz środkami ewidencyjnymi (np. ISAD, SEZAM, IZA)
- możliwość łatwego wyszukiwania poszczególnych jednostek i ich fragmentów.
Umożliwi to budowę ogólnopolskiego systemu informacji o zdigitalizowanym zasobie, a jeśli okaże się to celowe – utworzenie wspólnej biblioteki zeskanowanych materiałów na centralnym serwerze. System taki może być podstawą do budowy bazy danych uwzględniającej informacje o jednostce archiwalnej (a nie o pliku) – ale naszym zdaniem sama nazwa pliku nie powinna tych informacji zawierać. W proponowanej postaci ma on przede wszystkim umożliwiać odpowiedź, czy konkretny fragment konkretnej jednostki został już zeskanowany. Standard nie musi informować o technicznych parametrach skanu, dacie jego wykonania autorze itp. – mogą być one bowiem generowane automatycznie. Naszym założeniem było użycie w proponowanym systemie elementów głównie numerycznych, co ułatwi w przyszłości budowę systemów wyszukiwawczych.
3. Propozycja formatu opisu
Proponowany przez nas format opisu składa się z 8 elementów, w tym tylko jednego literowego. Są to:
- kod literowy kraju (w przypadku archiwów polskich – PL),
- numer archiwum (zgodny z bazą SEZAM),
- numer zespołu,
- ciąg dalszy numeru zespołu,
- sygnatura jednostki,
- numer karty (strony),
- cyfrowy symbol recto (1) / verso (2) – lub 0 w przypadku, gdy poprzedni element jest numerem strony, a nie karty,
- numer kolejny skanu (może się zdarzyć, że konkretna karta (strona) jednostki będzie posiadać kilka skanów, np. związanych z dokumentowaniem prac konserwatorskich czy stanowiących zbliżenia fragmentów strony – pieczęci, inicjałów itp.).
4. Przykład opisu
Przykładowy opis dla skanu z jednostki (dane z bazy SEZAM) 35/322/0/9 (Archiwum Państwowe w Lublinie, zespół: Akta Florentyna Jana Górskiego notariusza w Lublinie 1810-1822, sygn. jednostki: 9 [Księga aktów notarialnych nr 1671-1933]), karta 57 v, skan nr 1 – miałby postać:
PL-35-322-0-9-57-2-1
Kolejne elementy oznaczają:
PL – kraj,
35 – numer archiwum (Archiwum Państwowe w Lublinie – Centrala)
322 – numer zespołu
0 – ciąg dalszy numeru zespołu
9 – sygnatura jednostki
57 – numer karty
2 – oznaczenie verso
1 – pierwszy skan tej strony.
Proponowany przez nas standard stosujemy w Archiwum Państwowym w Lublinie. Mając świadomość różnorodności doświadczeń z digitalizacją w archiwach państwowych i chcąc je uwzględnić w możliwie najszerszej skali - pragniemy poddać go pod dyskusję na forum IFAR. Będziemy wdzięczni za wszelkie uwagi i komentarze.
Piotr Zawilsk:
Trochę jestem zdziwiony, że problem opisu skanów poruszony przez lubelskich kolegów nie spotkał się do tej pory z żadnym odzewem. :shock: Być może najtrudniej jest zacząć dyskusję. W zwiąku z tym Piotrków będzie pierwszy. Swego czasu w naszym archiwum problem opisu skanów był także dyskutowany i dla własnych potrzeb spróbowaliśmy opracować własny standart opisu zdając sobie przy tym sprawę, że problem wymaga szerszego omówienia i ustalenia standartów obowiązujących w całej sieci archiwlnej (problem był omawiany przy okazji próby zeskanowania w całości księgi posiedzeń Trybunału Koronnego). Jednakże z uwagi na to, że APPT nie jest tak dobrze wyekwipowane jak APL (AgfaScan 330 vs Minolta PS-700) zastosowany przez nas opis był dużo skromniejszy :wink: i ograniczył się kolejno do następujących pozycji:
nr archiwum
nr zespołu
sygnaturajednostki
nr strony
Teraz po lekturze artykułu kolegów z APL widzimy jak dalece "nasz" opis był daleki od doskonałości.
Moim skromnym zdaniem zaproponowany przez Lublin standart opisu skanów może stanowić podstawę do dalszej dyskusji. Nasz głos w tej sprawie ogranicza się do 2 kwestii:
1. Zaproponowany opis według mnie można spokojnie zastosować także do zdjęć cyfrowych materiałów archiwalnych wykonywanych w archiwach (kilka z nich w tym piotrkowskie zakupiło już aparaty cyfrowe dla swoich potrzeb). Tutaj zgłaszam gotowość do poprowadzenia dyskusji na temat zastosowania fotografii cyfrowej w archiwach państwowych.
2. Zaproponowany standart nie określa sposobu zapisu skanu/zdjęcia okładek jednostek archiwalnych. A te w archiwach państwowych były i są nadal fotografowane metodą tradycyjną. Tutaj można by zaproponować oznaczanie skanów/zdjęć okładek przy użyciu zer: jedno zero dla przedniej okładki, dwa zera dla tylnej (w dalszym ciągu zastowane byłoby oznaczenie recto/verso).
Pozdrawienia dla kolegów z APL
Piotr Zawilski
APPT
staszko67:
W jaki sposób zapisujecie fragmenty tej samej strony
Rafał Rufus Magryś:
Witam,
Tu jest nieco większy problem. To co do tej pory było zaproponowane nie przywidywało czegoś takiego jak "fragment strony". Ostatnio dyskutowaliśmy na ten temat w gronie osób zajmujących się w Lublinie digitalizacją i z dyskusji wyszło coś takiego:
Przyjmujemy, że struktura skanów ma charakter hierarchiczny tj. odzwierciedleniem fizycznym jest struktura katalogów a więc:
nr archiwum (katalog)-> nr zespołu(w nim katalog)->ciąg dalszy numeru zespołu (w nim katalog)-> nr jednostki (w nim katalog)->strona(w nim katalog w miarę potrzeby)
"W miarę potrzeby" oznacza, że jeśli strona ma kilka skanów (fragmentów lub dodatkowych obrazów koncentrujących się na jakimś szczególe -np. inicjale, pieczęci) tworzymy dla tej strony dodatkowy katalog i są one w nim umieszczone wraz z, jeśli to możliwe, skanem całości strony/karty. Dodatkowo fragmenty oznaczamy literą "f" dodawaną do wypracowanego wcześniej numeru skanu.
Jest to oczywiście propozycja dodatkowo można rzec "w fazie beta" - do przedyskutowania i (co ważniejsze) do sprawdzenia w praktyce.
sirsilis:
Jako ze zajmuje sie digitalizacja chce parę słów dorzucic
Re:
4. Przykład opisu
Przykładowy opis dla skanu z jednostki (dane z bazy SEZAM) 35/322/0/9 (Archiwum Państwowe w Lublinie, zespół: Akta Florentyna Jana Górskiego notariusza w Lublinie 1810-1822, sygn. jednostki: 9 [Księga aktów notarialnych nr 1671-1933]), karta 57 v, skan nr 1 – miałby postać:
PL-35-322-0-9-57-2-1
Kolejne elementy oznaczają:
PL – kraj,
35 – numer archiwum (Archiwum Państwowe w Lublinie – Centrala)
322 – numer zespołu
0 – ciąg dalszy numeru zespołu
9 – sygnatura jednostki
57 – numer karty
2 – oznaczenie verso
1 – pierwszy skan tej strony.
Niestety ja mam teki problem ze w pracy muszę wg wytycznych stosować nazwy plików również skomplikowane jak powyższy przykład Utrudnia mi to cholernie prace, bo ja nie skanuje tylko robie zdjęcia efekt podobny a szybciej....
moja propozycja
AP_35_322_9_0000
Kolejne elementy oznaczają:
AP – skrót od archiwum państwowe
35 – numer archiwum
322 – numer zespołu
9 – sygnatura jednostki
0000 – numer karty tj 0001, 0002, 0002v
z reszty elementów zrezygnowałbym...
wg mnie nazwy plików, skanów trzeba jak najbardziej uprościć
Nawigacja
[#] Następna strona
Idź do wersji pełnej