Reaktywując się na forum pozwolę sobie na kilka uwag:
przepraszam że wziąłem część z innego mojego postu który jest tu:
http://www.lublin.ap.gov.pl/ifar/ifarforum2/index.php?topic=840.0ale nie chce mi się jeszcze raz pisać.
w tej kwestii:
Bo jak ludzie będą archiwizować dobra kulturalne polskiej kinematografii i muzyki, to zostanie warezem z polskimi filmami i muzyką, przy okazji wymiatając mniejsze strony tego typu. Lekkie rozeznanie w tej materii mam i jeśli będą tutaj filmy to przyciągniecie rzesze piratów.
A teraz istotna rzecz:
Miejsce. Takie archiwa potrzebują znaczne ilości miejsca na dysku. Jaki macie pomysł na to? - Ten problem będzie wracał jak bumerang.
Otóż w Planie Informatyzacji Państwa
w części 7g PIP mamy:
"Opracowanie metodologii i prezentacji zasobów archiwalnych audio i wideo oraz udostępnianie ich na nośnikach informacji i przez Internet wraz z cyfryzacją zasobów archiwalnych" na co jest czas do grudnia 2009.
Co ważne, to zadanie wpisane jest z konkretnymi pieniędzmi w "Tabela 2. Zestawienie i charakterystyka sektorowych projektów teleinformatycznych" pt. PREZENTACJA I UDOSTĘPNIANIE ZASOBÓW ARCHIWALNYCH AUDIO I WIDEO. na to w latach 2007-2010 ma być przeznaczone 97 mln zł (15 % budżet państwa, 85 % Europejski Fundusz Rozwoju Regionalnego). To zresztą pokazuje jaką siłę przebicia mają ... inni. Oby NAC dostało (dodatkowo do tego co dotąd ADM!) choć połowę tych środków co Filmoteka Narodowa...
W kwestii formatów plików, metadanych, zarządzania w długim czasie, jakości itd... tematów poruszanych w tym wątku
PIP nakłada także inne obowiązki:
"Tabela 1. Działania w zakresie rozwoju społeczeństwa informacyjnego" w części 7a:
"Opracowanie metodologii archiwizacji cyfrowej (digitalizacji) różnego rodzaju zasobów archiwalnych, bibliotecznych i muzealnych oraz innych dokumentacji związanych z zabytkami, a także sposobów udostępniania ich w wersji cyfrowej. " Plan zakłada że zdarzy się to do końca czerwca 2007 (a więc mamy już kwartał opóźnienia).
Przypominam, że pracuje nad tym Zespół ds Digitalizacji powołany przez MKiDN który ma taką strategię digitalizacji przygotować - czyli odpowiedzieć na pytania co digitalizować i po co, a także w jaki sposób, za pomocą jakiego sprzętu, jakie wymagania techniczne dotyczące jakości (rozdzielczość, głębia bitowa, jakość koloru, częstotliwość próbkowania) formatów, metadanych (technicznych, opisowych, administracyjnych i "behawioralnych") itd. Nie będę jednak wieszał na nim psów bo sam jestem członkiem a problem jest bardzo złożony...
Co do pracy zespołu roboczego w zakresie standardów metadanych opisowych to była krótka piłka:
bibliotekarze mówili MARC, archiwiści EAD, muzealnicy SSWIM, a niżej podpisany złożył zdanie odrębne.
Otóż jak pokazuje praktyka krzyżują się dwa podejścia a mianowicie
- takie które zajmuje się tylko digitalizacją tego co już jest w bibliotekach i archiwach
- i takie które dotyczy archiwizacji dokumentów elektronicznych powstałych w wyniku działania podmiotów zewnętrznych.
Na razie są to działania osobne ale planując digitalizacje materiału analogowego trudno nie dostrzegać także i tego, że jednocześnie powstają obiekty cyfrowe nie mające "tradycyjnego" pierwowzoru. Można też przypuszczać, że dla użytkownika archiwów i bibliotek w niedalekiej przyszłości nie będzie istotne czy informacja do której dotarł, powstała najpierw w postaci analogowej czy cyfrowej. Ważna będzie treść informacji, jej wiarygodność oraz możliwość szybkiego odnalezienia. I szlag go trafi jeśli dla dokumentów elektronicznych powstałych od razu w takiej formie będzie miał inne zasady wyszukiwania, dostępu itd a dla tych zdigitalizowanych - inne. Prędzej czy później więc trzeba będzie znaleźć wspólny mianownik dla dokumentów elektronicznych - niezależnie od ich pochodzenia. Oczywiście można olać problem i stwierdzić że jak dotąd "rekordy" złapane przez bibliotekę opisuje się w MARC21 a przez archiwum w ISAD(G) (dla wielu: czytaj EAD). Obojętnie czy jest to film w MPEG4 (obojętnie czy tak powstały in statu nascendi czy w wyniku digitalizacji) czy też "strategia informatyzacji RP" w PDF-ie czy zeskanowane listy Cypriana Kamila Norwida bibliotekarze opiszą to w MARC21 a archiwiści w EAD... Prawda, że to byłoby co najmniej dyskusyjne? Więcej na tym forum już o tym pisałem np. tu:
http://www.lublin.ap.gov.pl/ifar/ifarforum2/index.php?topic=626.0Co do pracy zespołu roboczego w zakresie standardów technicznych to po zebraniu materiałów dotyczących tego co robią inni okazało się, że nie ma tu jakichś najlepszych rozwiązań, które można po prostu wskazać. Oczywiście są i tacy którzy zdecydowanie opowiadają się za konkretnymi przykładami (celowo nie podam jakie żeby nie zaogniać).
Rzucę garść problemów:
Otóż w zakresie standardów technicznych ważna jest specyfikacja techniczna dotycząca nie tylko samych plików (to w miarę proste) ale także (a może przede wszystkim) metadanych (technicznych, administracyjnych i behawioralnych).
Wszystko jest fajnie jak trzymamy nasze kopie cyfrowe uporządkowane np tak: jeden folder zawiera jedną pozycję książkową mającą 200 stron. Każda strona to osobny TIFF (wszyscy go kochają a więc i u nas tak będzie - zapomnijcie o PNG!). Skąd wiemy która jest która? Będziemy nadawać odpowiednie nazwy plikom?. Jeśli nie rozwiążemy tego problemu (metadane behawioralne) to nie da się automatycznie tworzyć np przeglądowych PDF-ów (czy jak kto woli DjVu). Tylko czy nasz "folder" będziemy w stanie utrzymać przez długo czas? A kto powiedział, że "foldery" w ogóle mają być ? A może po prostu zrobić to tak, że w każdym pliku zapisać metadane wskazujące do jakiej pozycji należy i jaka jest przed a jaka po... a może nie - tylko zapisać to w osobnym miejscu?
Oczywistym są postulaty żeby (tylko tam gdzie kolor lub odcienie szarości są ważne) skanować materiał wraz z wzorcem koloru lub szarości (jakim)? I tu pytanie: czy użytkownik cały czas ma widzieć ten wzorzec? Zwłaszcza w postaci przeglądowej mogłoby to go denerwować. A więc czy oprogramowanie NAC o którym tu już była mowa nie powinno umieć takiej "linijki" wycinać "w locie" przy przetwarzaniu masowym (wsadowym) do formatu przeglądowego? Przy okazji: może mi ktoś doradzi w jaki sposób ten wzorzec kłaść (może na jakim "czerwonym suknie" - w odróżnieniu od białego tła ... reszty tła) żeby oprogramowanie radziło sobie łatwo z "wycinaniem" wzorca? Inaczej będziemy mieli robotę głupiego dla ludzi. Robotę która kosztuje. Jeśli teraz pomyślimy nad standardowym tłem dla wzorca i standardowym miejscem jego umieszczania to może potem będzie taniej...
Kolejny problem to wiarygodność naszych skanów. I tu dochodzi problem tzw. "preservation metadata", które będą potrzebne aby pokazać historię powstania i przenoszenia danych... I te powinny być na zewnątrz obiektów cyfrowych które opisują, po prostu po to aby nie naruszać ich integralności.
Część metadanych technicznych z cała pewnością będzie zapisana bezpośrednio w plikach obrazów bez względu na to czy tego chcemy czy nie. Jeśli urządzenie będzie zapisywało w EXIF to z cała pewnością powinniśmy takie metadane zachować. Dla wiarygodności naszych kopii cyfrowych mogą to być istotne informacje a ich zachowanie nic nie kosztuje. Dlaczego jednak mielibyśmy to jeszcze wyprowadzać na zewnątrz? Wbrew pozorom to jest też ważne pytanie...
itd itp...
przepraszam ale może lepiej wrócę do pracy dla Zespołu ds Digitalizacji... bo tam trzeba coś konkretnego i do tego jeszcze wykonalnego zaproponować
aha, pewnie już tam byliście nie raz, ale jeśli nie to rzućcie okiem tu:
http://www.loc.gov/premis/ (standard metadanych do długoterminowego przechowywania obiektów cyfrowych)
i tu
www.loc.gov/mix (standard matadanych technicznych do obrazów rastrowych - także norma NISO)
a potem koniecznie tu:
http://www.prov.vic.gov.au/vers/vers/default.htm (cała polityka przechowywania dokumentów elektronicznych)
i zobaczyć w samej specyfikacji metadanych która jest tu:
http://www.prov.vic.gov.au/vers/standard/pdf/99-7-2_Std_ver2-0.pdf jakich elementów VERS nie uwzględnia a które były w "NAA recordkeeping metadata standard" wymienione...
jak jeszcze dołozymy doń to:
www.archives.gov/research/arc/digitizing-archival-materials.htmlhttp://memory.loc.gov/ammem/about/techStandards.pdfhttp://www.nla.gov.au/digital/standards.htmlto zobaczymy jakże wiele spraw jest do ustalenia.
Oczywiście można podejść do problemu standardów jak Australijczycy z instytutu od Aborygenów:
http://www.aiatsis.gov.au/__data/assets/pdf_file/7034/Technical_Standards_inc_video_V8.pdfkrótko, węzłowato i na temat... no nie?
albo (jak zwykle w Polsce) poczekać na to co zrobią Amerykanie... czy też przetłumaczyć ogłoszony przed 3 laty materiał NARA i wskazać jako wskazówki obowiązujące....
i w takim otoczeniu działa (działać ma) NAC
))
trzeba życzyć powodzenia i wpisania do kolejnego planu informatyzacji państwa z kwotą nie mniejszą niż na Filmotekę Narodową - co niniejszym czynię.