Internetowe Forum Archiwalne > Help desk
Data Preservation - narzędzia
Grzegorz Gałęzowski:
NutchWAX
Oprogramowanie do indeksowania plików ARC (zarchiwizowane witryny Web przy użyciu programu Heritrix) i następnie do wyszukiwania pełnotekstowego. NutchWAX oparty jest na licencji open-source, wyszukiwarki internetowej Nutch.
Autor: Internet Archive
Napisane w języku: Java
System operacyjny i środowisko: Niezależny od platformy, testowany wyłącznie w systemie Linux.
Aplikacja: http://archive-access.sourceforge.net/projects/nutchwax/
Dokumentacja: http://archive-access.sourceforge.net/projects/nutchwax/apidocs/overview-summary.html
Licencja: GNU Lesser General Public License 2.1
Ostatnia aktualizacja programu: 1/17/07
Grzegorz Gałęzowski:
PAWN
Producer-Archive Workflow Network (PAWN) to system pracy przeznaczony dla osób, które mają małe kolekcje cyfrowych plików, które następnie muszą być przetwarzane w systemach zajmujących się długotrwałym przechowywaniem danych. PAWN nie oferuje długoterminowej archiwizacji i jest wykorzystywany jedynie do zarządzania takimi systemami.
Całość składa się z:
- Client, służący do pobierania danych, zarządzania użytkownikami i organizacją zapisu.
- Management server. Kontrola i zarządzanie serwerem.
- Scheduler. Przydziela miejsca na serwerze i kontroluje konfiguracje serwerów.
- Receiving server. Odbiera dane od klientów, umożliwia zmianę danych w zależności od poświadczeń i przekazuje dane w kierunku zatwierdzonym przez użytkowników.
Autor: University of Maryland
Napisane w języku: Java
System operacyjny i środowisko: Środowisko Web. Wymagana Java 1.5 (Java 5) lub nowsza.
Aplikacja: http://adaptwiki.umiacs.umd.edu/twiki/bin/view/Main/PawnDemoClient
Dokumentacja: http://narawiki.umiacs.umd.edu/twiki/bin/view/Main/PAWN
Licencja: Każdy kto jest zainteresowany aplikacją proszony jest o kontakt na e-mail: joseph@umiacs.umd.edu
Ostatnia aktualizacja programu: 01/2008.
Grzegorz Gałęzowski:
TubeKit
TubeKit to zestaw narzędzi do tworzenia robotów dla serwisu YouTube. Pozwala użytkownikom na stworzenie własnych narzędzi, które będą indeksować zawartość serwisu YouTube na podstawie 17 różnych atrybutów. TubeKit pomaga we wszystkich etapach pracy, od stworzenia bazy danych aż do przeglądania i przeszukiwania interfejsów, które zapewniają dostęp do zgromadzonych danych.
Autor: University of North Carolina at Chapel Hill, School of Information and Library Science
Napisane w języku: PHP.
System operacyjny i środowisko: N/D. Środowisko Web.
Aplikacja: http://www.tubekit.org/download.php
Dokumentacja: http://www.tubekit.org/index.php
Licencja: N/D
Ostatnia aktualizacja programu: 10/5/2008
Grzegorz Gałęzowski:
Wayback Machine
Wayback Machine to potężny system służący do wyszukiwania archiwizowanych stron za pomocą Heritrix (pliki ARC lub WARC).
Autor: Internet Archive
Napisane w języku: Java
System operacyjny i środowisko: serwer Tomcat
Aplikacja: http://archive-access.sourceforge.net/projects/wayback/
Dokumentacja: http://archive-access.sourceforge.net/projects/wayback/administrator_manual.html
Licencja: GNU Lesser General Public License 2.1 (http://archive-access.sourceforge.net/projects/wayback/license.html); migracja w przyszłości do Apache License 2.0
Ostatnia aktualizacja programu: 2/6/2008
Grzegorz Gałęzowski:
Web Archives Workbench
Web Archives Workbench to zestaw narzędzi do przechwytywania zasobów Web. Zarządza zarchiwizowaną treścią z agregowanych danych. Całość składa się z:
-Discovery Tool, pomaga w identyfikacji potencjalnych witryn, które będą indeksowane
-Properties Tool, narzędzie odpowiedzialne za metadane archiwizowanych witryn Web
-Analysis Tool, umożliwia analizę struktury witryny
-Harvest Tool, narzędzie służące do monitorowania postępu indeksowania stron. Informacje kodowane są z wykorzystaniem Dublin Core.
Autor: OCLC
Napisane w języku: Java, JavaScript, JSP
System operacyjny i środowisko: Linux
Aplikacja: http://sourceforge.net/projects/webarchivwkbnch
Dokumentacja: Dostępna na stronie SourceForge
Licencja: Dostępna na stronie SourceForge
Ostatnia aktualizacja programu: 9/12/2007
Nawigacja
[#] Następna strona
Idź do wersji pełnej