Autor Wątek: Szablon do indeksacji asc  (Przeczytany 8802 razy)

0 użytkowników i 1 Gość przegląda ten wątek.

Offline Młochowski_Jacek

  • słuchacz(ka)
  • Wiadomości: 24
  • Płeć: Mężczyzna
    • mlochowski.com
Szablon do indeksacji asc
« dnia: Październik 09, 2010, »
W dniu 2010-10-07 odbyło się w NDAP na Rakowieckiej sympozjum naukowe ?Digitalizacja i indeksacja akt stanu cywilnego. Projekt pilotażowy? http://www.asc.genealodzy.pl/index.php . Z przygotowanych na sympozjum wystąpień wynika, że digitalizacja i indeksacja aktów stanu cywilnego prowadzona jest w wielu archiwach. W przeszłości były to oddolne inicjatywy na własny użytek ułatwiające prowadzenie kwerend we własnych. Efektem jest różnorodność formatów danych. Dlatego tak ważnym zagadnieniem jest wypracowanie standardu w tym zakresie i przyjęcie go przez jak najszerszą grupę podmiotów indeksujących. Forum archiwalne jest bez wątpienia najlepszym miejscem by zasięgnąć opinii i zapoznać się z uwagami fachowców archiwistów.  Aby nie rozpoczynać dyskusji o zera proponuję odnieść się do szablonu wypracowanego dla potrzeb indeksacji w projekcie pilotażowym. Szablon dostępny jest na stronie http://www.metryki.genealodzy.pl/jak-indeksowac-U-Z.php Dla wyjaśnienia dodam, że ASC i METRYKI są projektami siostrzanymi opartymi o te same mechanizmy tworzenia indeksów i prezentowania wyników.
Ze względu na różnorodne i często wykluczające się oczekiwania podmiotów indeksujących proponujemy stworzenie szablonów w których wykorzystać można będzie ściśle określony zakres podstawowy, rozszerzony i pełny. Szablony dla indeksacji urodzeń  i zgonów mogą posiadać, i w projekcie pilotażowym posiadają, identyczny  format danych. Zakładam, że struktura poszczególnych baz danych pozostanie różna, podobnie jak dla przykładu wsparcie dla wyszukiwania oboczności czy forma prezentacji danych. Standaryzacji podlegać powinien tylko i wyłącznie szablon danych. Każdą bazę wyposażyć można w podstawowy lub dodatkowy panel administracyjny lub dodatkową formatkę do wprowadzania i wyprowadzania danych w ściśle określonym, zgodnym ze standardem,  formacie danych. Umożliwi to także prostą wymianę danych.
Standaryzacji podlegać powinny:
- ilość i kolejność kolumn w szablonie,
- szczegółowe zasady (opis) tego co w jaką komórkę należy wpisać,
- które, ile i w jakiej kolejności kolumny należą do zakresu podstawowego,
- które, ile i w jakiej kolejności kolumny należą do zakresu rozszerzonego,
- od której kolumny zaczyna się zakres pełny zawierający dodatkowe kolumny według uznania i potrzeb.

Zakładam, że zakresu pełnego nie określimy by szablon mógł pozostać otwarty.
Dlatego zanim zapadnie decyzja przyjmująca  standard w tym zakresie potrzebna jest szeroka dyskusja w środowisku genealogów i archiwistów do której zapraszam. 

Offline Hanna Staszewska

  • Moderator
  • st. kustosz(ka)
  • *****
  • Wiadomości: 1744
Odp: Szablon do indeksacji asc
« Odpowiedź #1 dnia: Październik 12, 2010, »
Witam,
to dobry pomysł, żeby na iFAR podyskutować o indeksowaniu asc, bo problem wart jest "roztrząśnięcia" :)

1. Na początek przypomnę, że każdy wpis w księdze metrykalnej można potraktować jako odrębny poziom opisu, wg standardu ISAD będzie to najniższy poziom: dokument/obiekt/cząstka (termin do wyboru :)). Przypomnę też, że aby prawidłowo przygotować opis na jakimkolwiek poziomie (również tym wskazanym), musi on zawierać 6 obowiązkowych elementów: sygnatura, tytuł, twórca, daty, rozmiar, poziom opisu).  Myślę, że dobrze byłoby, aby twórcy bazy "pochylili" się nad tą kwestią.

2. Oglądam te wpisy w bazie, w wyszukiwarce znalazłam jakieś nazwiska i zastanawiam się, co dalej? Nie widzę tu podstawowych danych identyfikujących wpis, czyli nazwę i nr archiwum, nazwę i nr zespołu, sygnaturę jednostki, z której wpis pochodzi. Jeśli tych danych nie ma, to ja nie bardzo wiem, po co ta indeksacja...

Przepraszam, może czegoś nie widzę lub nie rozumiem, jeśli tak jest, proszę mnie oświecić.

Pozdrawiam
 

Offline mooj

  • słuchacz(ka)
  • Wiadomości: 29
Odp: Szablon do indeksacji asc
« Odpowiedź #2 dnia: Październik 12, 2010, »
Indeksacja przygotowana jest dla potrzeb kwerendzisty, nie zawodowego archiwisty, wydawałoby się, że jeśli z narzędziem poradzi sobie amator to i profesjonalista powinien..w drugą stronę to nie działa na ogół (a szkoda...)


Szablon służy do uporządkowanego wprowadzania danych, jest elementem większej całości
Przechodząc do meritum - z punktu widzenia informacji błędem jest (moim zdaniem) wprowadzanie na każdym poziomie, i na każdym etapie informacji o sześciu wskazanych elementach. Można (jeśli można, a czy można to poniżej) zrobić to na innym etapie.

ad Nazwa i numer archiwum (powiązane z sygnatura):
pierwopisy ksiąg Aktów Stanu Cywilnego jak i księgi metrykalne przechowywane są często w kancelariach parafialnych. O ile mi wiadomo stosowany obecnie system nie pozwala na nadanie jednoznacznej, powszechnie stosowanej sygnatury w odniesieniu do tych dokumentów. Krótko: nazwy i numeru archiwum:
- nie ma (nie "nie jest wprowadzona" a po prostu nie ma:)
- nie wiem czy jest sens, aby było to tak kodowane
- jeśli będzie, to należałoby śledzić losy dokumentów (czy nie zostały przekazane z kancelarii do np Archiwum Diecezjalnego)
(analogia: prowadzenie bazy ASC przechowywanych w Archiwum USC, które będą przekazane do AP)
Takie monitorowanie wykracza poza zakres indeksacji.
W przypadku indeksacji zasobów z AP numer zespołu widnieje w nazwie pliku.
Czyli tam gdzie jest to możliwe - jest uwzględniane, a użytkownik bazy informację taką otrzyma (jednak nie musi być ona wprowadzana na poziomie wprowadzania tego omawianego fragmentu rekordu). Tzn ja też postuluję, aby taka informacja była osiągalna

Analogicznie tytuł

Baza jest przygotowywana "pod kątem" użyteczności dla kwerendzisty. Być może dla archiwisty (zakładając, że akurat kwerendzistą nie jest:) nie jest przydatna:) i jest jednym z narzędzi - nie jedynym!

a po co?
Aby odnaleźć akt stanu cywilnego dotyczący danej osoby
na wejściu:
nazwisko [imiona] , zakres lat , [inne: np określeniu w przestrzeni punktu i promienia poszukiwań]

na wyjściu:
a. co najmniej (uboższa wersja)
USC (parafia) , Typ (Urodzenia/Chrzty Małżeństwa Zgony), Rok, Numer Aktu, imiona, nazwisko, dane rodziców / małżonka
czyli lista rekordów w których występuje zadane nazwisko (ew. imiona i nazwisko)
b. (bogatsza) j.w. ale zadane + "podobne" nazwisko
c. () jw. + kopia aktu on-line
d. bardziej rozbudowane etc etc


plus informacja w raporcie (to na razie postulat) o wynikach negatywnych - tj co zostało przeszukane z wynikiem negatywnym


narzędzia dopełniające to (mogą i a niektóre powinny być) np

- gdzie jest przechowywany oryginał i drugi egzemplarz (i tu może być numer archiwum)
- sugestia (szczególnie przydatna w przypadku wyników negatywnych) "co warto przeszukać" czyli zespoły i jednostki powiązane tematycznie, z jakimś elementem wspólnym (terytorium, czas, typ, inne ) z zapytaniem
- jakiś bardziej niż obecnie stosowany wstęp do inwentarza elektronicznego (np powiązanie kopią ówczesnych przepisów, aby przeciętny użytkownik mógł wiedzieć czym ASC był, jak rozumieć co w nim jest/powinno być)


Niektóre z pól są mniej potrzebne, niektóre być może należałoby dodać. Ale niekoniecznie do formularza wprowadzania danych. Można to jeden albo i kilka poziomów wyżej wprowadzić.

nie sądzę, aby to co napisałem oświecało...ale może jakiś ognik? iskierka?:) tzn chętnie wyjaśnię coś więcej, a jeszcze chętniej poczytam dużo więcej

pozdrawiam serdecznie
Włodek Sroczyński

Offline Młochowski_Jacek

  • słuchacz(ka)
  • Wiadomości: 24
  • Płeć: Mężczyzna
    • mlochowski.com
Odp: Szablon do indeksacji asc
« Odpowiedź #3 dnia: Październik 13, 2010, »
Archiwum cyfrowe METRYKI.genealodzy.PL zawiera elektroniczne zespoły archiwalne będące kopiami papierowych zespołów. Jednostki archiwalne są kopiami papierowych j.a.  (ksiąg metrykalnych). W przeciwieństwie do akt mechanicznych do których bez Pradziada lub inwentarzy nie sposób dotrzeć, cyfrowe zasoby ułożone są w następujący sposób: http://metryki.genealodzy.pl/metryki.php tworząc pewne zbiory i podzbiory.

- Województwo http://metryki.genealodzy.pl/woj-MZ  (lub obszar terytorialny innych państw leżących na terenach dawnych ziem polskich).
- Powiat http://metryki.genealodzy.pl/pow-59 .
- Zespół archiwalny (zespoły ksiąg) http://metryki.genealodzy.pl/zs9264d .
- Jednostki archiwalne (księgi) http://metryki.genealodzy.pl/metryki.php?op=kt&zs=9264d&sy=302 http://metryki.genealodzy.pl/metryki.php?op=kt&zs=9264d&sy=303 .
- Katalog (część księgi np. rocznik lub rodzaj Urodzenia Małżeństwa Zgony) http://metryki.genealodzy.pl/metryki.php?op=kt&zs=9264d&sy=304&kt=2 .

Tak więc wybranie województwa wyświetli listę jego powiatów a wybranie powiatu wyświetli listę zespołów (inwentarz).

Na poziomie zespołów i jednostek archiwalnych zasoby zostaną opisane tak aby zawierały wymagane elementy: sygnatura, tytuł, twórca, daty, rozmiar, poziom opisu. Opisy będą zawierać informacje o pierwowzorach z których zrobiono kopie, miejscu ich przechowywania etc.

Wyszukiwarka nazwisk http://metryki.genealodzy.pl/metryki.php?op=ch w pierwszym kroku tj. po wpisaniu nazwiska wyświetli raport zawierający liczbę wystąpień szukanego nazwiska w każdym z zespołów archiwalnych. Zespoły zostaną jednoznacznie oznaczone i zaopatrzone w link do pełnego ich opisu. Po wybraniu (kliknięciu) danego zespołu wyświetli się raport zawierający wszystkie wystąpienia nazwiska wraz z pozostałymi danymi zawartymi w aktach. Pełny opis zespołu z elementami jw. znajdował się będzie w nagłówku raportu a link do opisu jednostki zawarty będzie w każdym prezentowanym rekordzie.  Oprócz informacji  o jednostce archiwalnej, danych z aktu każdy rekord zawierać będzie link do obrazu aktu którego dotyczy.

Zagadnienia te mimo że niezwykle istotne jako dane wyższego poziomu nie są zawarte w  szablonie indeksacyjnym który poddajemy ocenie. 

Offline Młochowski_Jacek

  • słuchacz(ka)
  • Wiadomości: 24
  • Płeć: Mężczyzna
    • mlochowski.com
Odp: Szablon do indeksacji asc
« Odpowiedź #4 dnia: Październik 16, 2010, »
Chciałbym poddać pod dyskusję przydatność poszczególnych informacji zawartych w szablonie indeksacji. Z ich istotności i użyteczności wynikać powinno, czy zawarte zostaną w zakresie podstawowym czy rozszerzonym.
Dotychczas spotkałem się z bardzo różnorodnymi opiniami. Istnieje dość duża grupa mininalistów, którzy poprzestaliby na imieniu, nazwisku, roku i numeru aktu. Osoby te często skłonne byłyby robić indeksy przede wszystkim z istniejących skorowidzów. Takie podejście zapewni największą szybkość indeksacji przy minimalnym wysiłku. Spotkałem się też z opiniami ludzi próbujących tworzyć genealogię całych parafii tzn. podawać wszelkie informacje dostępne w aktach, umożliwiające późniejsze tworzenie powiązań bez konieczności każdorazowej weryfikacji aktów. W takim przypadku wszelkie istotne dane byłyby wynotowywane na etapie indeksowania. Bo przecież z nazwisk świadków można również wnioskować o pokrewieństwie. To oczywiście skrajne oczekiwania i możliwy jest kompromis. O ile dokładna data zdarzenia lub imiona rodziców są łatwe do późniejszego odszukania ich w akcie dostępnym często on-line, o tyle zawarcie w indeksach nazwisk rodowych często jest jedynym sposobem by bez przeglądania aktu po akcie znaleźć potomstwo kobiet o szukanym nazwisku panieńskim.
Inną ważną do rozstrzygnięcia kwestią jest pisownia nazwisk i imion w brzmieniu oryginalnym czy też spolszczonym. W przypadku nazwisk zaproponowałem by w bazie znalazły się odrębne pola dla nazwisk w obu pisowniach. Wystarczy wypełnić jedno z tych pól najlepiej nazwisko w brzmieniu współczesnym  po polsku zamiast np. form  -ówna -owa -anka itp. Jeśli formy współczesnej nie można jednoznacznie odtworzyć, wówczas należy zapisać nazwisko w brzmieniu oryginalnym ale w polu do tego przeznaczonym.
Spotkałem się też z opiniami, że podobnie należy rozwiązać kwestie imion. Niektórzy sugerowali by pisać imiona spolszczone, inni żeby pisać zgodnie z brzmieniem w akcie. Moja propozycja jest taka, by pisać je w brzmieniu występującym w akcie za pomocą znaków alfabetu polskiego. Pisownia imion w akcie wydaje się mieć drugorzędne znaczenie gdyż pierwszym kryterium wyszukiwania jest nazwisko. Reasumując, poza informacjami wyższego rzędu opisującymi zasób czy jednostkę, najistotniejsze wydają się dane identyfikujące akt, a więc rok i numer aktu lub numer strony, a z danych opisujących osobę nazwisko, nazwiska alternatywne, panieńskie, nazwiska panieńskie matek, pierwsze imię i dopiero w następnej kolejności, miejsce (siedziba parafii lub USC są danymi wyższego rzędu), kolejne imiona i imiona rodziców. W indeksach archiwów elektronicznych bardzo istotną informacją jest nazwa pliku (pełna ścieżka do pliku jest daną wyższego rzędu zapisaną w informacji o jednostce lub jej części).
Najbardziej interesuje mnie Wasze zdanie w kwestii pisania nazwisk oraz ważności poszczególnych pól tj. co na pewno powinno znaleźć się w zakresie podstawowym szablonu indeksacji.

Offline Hanna Staszewska

  • Moderator
  • st. kustosz(ka)
  • *****
  • Wiadomości: 1744
Odp: Szablon do indeksacji asc
« Odpowiedź #5 dnia: Październik 18, 2010, »
Witam,

Chciałbym poddać pod dyskusję przydatność poszczególnych informacji zawartych w szablonie indeksacji. Z ich istotności i użyteczności wynikać powinno, czy zawarte zostaną w zakresie podstawowym czy rozszerzonym.
W tej materii niestety wiele nie doradzę, gdyż to sami genealodzy muszą zdecydować, jaki rozmiar ma przyjąć indeksacja.

Inną ważną do rozstrzygnięcia kwestią jest pisownia nazwisk i imion w brzmieniu oryginalnym czy też spolszczonym. W przypadku nazwisk zaproponowałem by w bazie znalazły się odrębne pola dla nazwisk w obu pisowniach.
Zgadzam się, to rozsądna propozycja.
Jeśli chodzi o imię, chyba należałoby je pisać w wersji spolszczonej. 

najistotniejsze wydają się dane identyfikujące akt, a więc rok i numer aktu lub numer strony, a z danych opisujących osobę nazwisko, nazwiska alternatywne, panieńskie, nazwiska panieńskie matek, pierwsze imię i dopiero w następnej kolejności, miejsce (siedziba parafii lub USC są danymi wyższego rzędu), kolejne imiona i imiona rodziców.
Moim zdanie miejsce powinno być w podstawowym zestawie informacji. I tu należy zastanowić się, jak to miejsce podawać: w przypadku np. miejscowości z zaboru pruskiego miały one nazwę niemiecką, mogły też (i to zdarza się bardzo często) w ciągu wielu lat istnienia zmieniać brzmienie i pisownię nazwy. Kolejny problem: czy miejscowość identyfikować jakoś bliżej, np. przez podanie nazwy gminy (z jakiego okresu?), powiatu (z jakiego okresu?) itp.

Pozdrawiam
PS. W internecie funkcjonuje kilka podobnych projektów, czy one są jakoś kompatybilne? Czy środowisko genealogów (którego wysiłki na polu indeksacji są godne podziwu) wypracowało wspólne schematy opisu danych, czy też każde towarzystwo robi to indywidualnie...

Offline mooj

  • słuchacz(ka)
  • Wiadomości: 29
Odp: Szablon do indeksacji asc
« Odpowiedź #6 dnia: Październik 18, 2010, »
"I tu należy zastanowić się, jak to miejsce podawać: w przypadku np. miejscowości z zaboru pruskiego miały one nazwę niemiecką, mogły też (i to zdarza się bardzo często) w ciągu wielu lat istnienia zmieniać brzmienie i pisownię nazwy. Kolejny problem: czy miejscowość identyfikować jakoś bliżej, np. przez podanie nazwy gminy (z jakiego okresu?), powiatu (z jakiego okresu?) itp."

jestem zdecydowanym zwolennikiem określania miejsca poprzez współrzędne geograficzne
uniwersalnie (języki),
bez wątpliwości związanych z nazwą (jednoznaczność vs wieloznaczność), podziałem administracyjnym
do wykorzystania w grafikach (mapy) i opracowaniach (identyfikacja najbliższych miejsc, pomiar odległości etc)
elastycznie (odnośniki)
oprócz jednej wady - przełamania przyzwyczajeń - same zalety
Włodek Sroczyński

Offline Młochowski_Jacek

  • słuchacz(ka)
  • Wiadomości: 24
  • Płeć: Mężczyzna
    • mlochowski.com
Odp: Szablon do indeksacji asc
« Odpowiedź #7 dnia: Październik 18, 2010, »
Proszę mi wybaczyć jeśli najpierw zapytam a potem forsował będę swoje zdanie. Może to wyglądać tak jakbym nie potrzebował rady ale w rzeczywistości tak nie jest. Staram się przedstawić znane mi argumenty za przyjęciem proponowanego rozwiązania, ale liczę na konstruktywną krytykę jeśli warto coś rozwiązać inaczej.
Moim zdanie miejsce powinno być w podstawowym zestawie informacji. I tu należy zastanowić się, jak to miejsce podawać: w przypadku np. miejscowości z zaboru pruskiego miały one nazwę niemiecką, mogły też (i to zdarza się bardzo często) w ciągu wielu lat istnienia zmieniać brzmienie i pisownię nazwy.
Nazwę miejscowości (urodzenia lub zgonu) zaliczam do zakresu rozszerzonego. Siedziba USC/parafii jako dana wyższego rzędu znajduje się w opisie jednostki i jako taka przypisana jest do każdego rekordu. (lub odwrotnie: rekord przypisany jest do j.a.) Dodanie obok nazwy polskiej siedziby USC/parafii nazwy używanej w czasie zapisywania księgi nie będzie stanowiło problemu. W przypadku miejscowości zdarzenia występującego w akcie (miejscowość wpisywana do szablonu indeksacji), chyba należy przyjąć nazwę oryginalną zapisaną za pomocą liter alfabetu polskiego (bez umlautów i cyrylicy).

Kolejny problem: czy miejscowość identyfikować jakoś bliżej, np. przez podanie nazwy gminy (z jakiego okresu?), powiatu (z jakiego okresu?) itp.
Moim zdaniem, jeśli będzie taka potrzeba to tylko w opisie jednostki. Tak więc w szablonie indeksacji tylko pojedyncza nazwa.

W internecie funkcjonuje kilka podobnych projektów, czy one są jakoś kompatybilne? Czy środowisko genealogów (którego wysiłki na polu indeksacji są godne podziwu) wypracowało wspólne schematy opisu danych, czy też każde towarzystwo robi to indywidualnie...
Projekty indeksacji tworzone przez genealogów to oddolne inicjatywy i podobnie jak te tworzone przez archiwistów mają bardzo różne szablony. Do dzisiaj oba nasze projekty "Geneteka" i "Metryki" używają różnych szablonów. Stąd próba standaryzowania szablonu dla wszystkich genealogów i archiwistów. Potrzebę standaryzacji zauważył zespół roboczy NDAP-PTG półtora roku temu i był to jeden z celów pilotażowego projektu indeksacji a.s.c. AP. Być może szablon ten znajdzie się w wytycznych do indeksacji w AP, więc dotyczy on archiwistów również.

Offline Hanna Staszewska

  • Moderator
  • st. kustosz(ka)
  • *****
  • Wiadomości: 1744
Odp: Szablon do indeksacji asc
« Odpowiedź #8 dnia: Październik 19, 2010, »
Siedziba USC/parafii jako dana wyższego rzędu znajduje się w opisie jednostki i jako taka przypisana jest do każdego rekordu. (lub odwrotnie: rekord przypisany jest do j.a.)
Czy to znaczy, że genealodzy będą korzystać z opisów jednostek, które sporządzili archiwiści, czyli z naszych archiwalnych inwentarzy? To byłoby logiczne i jak najbardziej wskazane.
Ale...,
jeśli tak, to z miejscowością może być różnie, bo większość tytułów j.a. nie zawiera nazwy miejscowości: są to najczęściej tytuły: Księga urodzeń, Księga małżeństw itd...

Pozdrawiam