Internetowe Forum Archiwalne > Help desk

Data Preservation - narzędzia

<< < (3/4) > >>

Grzegorz Gałęzowski:
NutchWAX

Oprogramowanie do indeksowania plików ARC (zarchiwizowane witryny Web przy użyciu programu Heritrix) i następnie do wyszukiwania pełnotekstowego. NutchWAX oparty jest na licencji open-source, wyszukiwarki internetowej Nutch.

Autor: Internet Archive

Napisane w języku: Java

System operacyjny i środowisko: Niezależny od platformy, testowany wyłącznie w systemie Linux.

Aplikacja:  http://archive-access.sourceforge.net/projects/nutchwax/

Dokumentacja: http://archive-access.sourceforge.net/projects/nutchwax/apidocs/overview-summary.html

Licencja: GNU Lesser General Public License 2.1

Ostatnia aktualizacja programu: 1/17/07

Grzegorz Gałęzowski:
PAWN

Producer-Archive Workflow Network (PAWN) to system pracy przeznaczony dla osób, które mają małe kolekcje cyfrowych plików, które następnie muszą być przetwarzane w systemach zajmujących się długotrwałym przechowywaniem danych. PAWN nie oferuje długoterminowej archiwizacji i jest wykorzystywany jedynie do zarządzania takimi systemami.

Całość składa się z:

- Client, służący do pobierania danych, zarządzania użytkownikami i organizacją zapisu.
- Management server. Kontrola i zarządzanie serwerem.
- Scheduler. Przydziela miejsca na serwerze i kontroluje konfiguracje serwerów.
- Receiving server. Odbiera dane od klientów, umożliwia zmianę danych w zależności od poświadczeń i przekazuje dane w kierunku zatwierdzonym przez użytkowników.

Autor: University of Maryland

Napisane w języku: Java

System operacyjny i środowisko: Środowisko Web. Wymagana Java 1.5 (Java 5) lub nowsza.

Aplikacja: http://adaptwiki.umiacs.umd.edu/twiki/bin/view/Main/PawnDemoClient

Dokumentacja: http://narawiki.umiacs.umd.edu/twiki/bin/view/Main/PAWN

Licencja: Każdy kto jest zainteresowany aplikacją proszony jest o kontakt na e-mail: joseph@umiacs.umd.edu

Ostatnia aktualizacja programu: 01/2008.

Grzegorz Gałęzowski:
TubeKit

TubeKit to zestaw narzędzi do tworzenia robotów dla serwisu YouTube. Pozwala użytkownikom na stworzenie własnych narzędzi, które będą indeksować zawartość serwisu YouTube na podstawie 17 różnych atrybutów. TubeKit pomaga we wszystkich etapach pracy, od stworzenia bazy danych aż do przeglądania i przeszukiwania interfejsów, które zapewniają dostęp do zgromadzonych danych.

Autor: University of North Carolina at Chapel Hill, School of Information and Library Science

Napisane w języku: PHP.

System operacyjny i środowisko: N/D. Środowisko Web.

Aplikacja: http://www.tubekit.org/download.php

Dokumentacja: http://www.tubekit.org/index.php

Licencja: N/D

Ostatnia aktualizacja programu: 10/5/2008

Grzegorz Gałęzowski:
Wayback Machine

Wayback Machine to potężny system służący do wyszukiwania archiwizowanych stron za pomocą  Heritrix (pliki ARC lub WARC).

Autor: Internet Archive

Napisane w języku: Java

System operacyjny i środowisko: serwer Tomcat

Aplikacja: http://archive-access.sourceforge.net/projects/wayback/

Dokumentacja: http://archive-access.sourceforge.net/projects/wayback/administrator_manual.html

Licencja: GNU Lesser General Public License 2.1 (http://archive-access.sourceforge.net/projects/wayback/license.html); migracja w przyszłości do Apache License 2.0

Ostatnia aktualizacja programu: 2/6/2008

Grzegorz Gałęzowski:
Web Archives Workbench

Web Archives Workbench to zestaw narzędzi do przechwytywania zasobów Web. Zarządza zarchiwizowaną treścią z agregowanych danych. Całość składa się z: 

-Discovery Tool, pomaga w identyfikacji potencjalnych witryn, które będą indeksowane

-Properties Tool, narzędzie odpowiedzialne za metadane archiwizowanych witryn Web

-Analysis Tool, umożliwia analizę struktury witryny

-Harvest Tool, narzędzie służące do monitorowania postępu indeksowania stron. Informacje kodowane są z wykorzystaniem Dublin Core.

Autor: OCLC

Napisane w języku: Java, JavaScript, JSP

System operacyjny i środowisko: Linux

Aplikacja: http://sourceforge.net/projects/webarchivwkbnch

Dokumentacja: Dostępna na stronie SourceForge

Licencja: Dostępna na stronie SourceForge

Ostatnia aktualizacja programu: 9/12/2007

Nawigacja

[0] Indeks wiadomości

[#] Następna strona

[*] Poprzednia strona

Idź do wersji pełnej