Z tego, co tu napisane, wychodzi mi, że aplikacja ta miałaby działać przez przeglądarkę. Moim zdaniem nie jest to najlepszy pomysł (szczególnie gdy mowa np. o plikach 400MB). Przeglądarki nie mają mechanizmów sprawdzających poprawność wysyłanych (a właściwie to serwer - odebranych, bo przeglądarka nie wysyła żadnych dodatkowych informacji) danych, nie ma możliwości sprawdzenia, na jakim etapie jest wysyłanie.
Wydaje mi się, że najlepszym rozwiązaniem byłoby rozszerzenie programu z projektu nr 1 o możliwość współpracy z jakąś aplikacją na serwerze - tam aplikacja posiadająca kolejkę obrazów do przetworzenia, raportując postęp prac użytkownikowi (-om), wykonywałaby polecenia zadane przez użytkownika siedzącego przy identycznym interfejsie jak by pracował lokalnie - właśnie kadrowanie, obracanie, dopasowanie kolorów itd. na jakimś podglądzie i wysłanie zadania (informacji, co z danym obrazem trzeba zrobić) z całym plikiem na serwer. (Jak jeszcze raz przejrzałem post @minder - to właśnie o tym pisał) Tutaj prędzej zgodziłbym się na wykorzystanie pythona (widzę zwolennika
), ale też nie jestem pewien, czy jest to najlepszy pomysł, kiedy mamy pod ręką Piotra, który chce pomóc. Łączenie aplikacji, które w całej swojej idei miały pracować jako tandem, pisanych w dwóch różnych językach, wydaje mi się niepotrzebne.
Należałoby za to przede wszystkim zdefiniować sposób komunikacji z serwerem, tak by każdy mógł napisać własny program działający po stronie klienta, który będzie mu bardziej pasował (np. zintegrowany z jakimś innym systemem - bibliotekarskim czy jakimkolwiek innym), a dopiero potem połączyć te dwa do kupy.
Wykorzystanie technologii stricte webowej (przeglądarka, po drugiej stronie - najłatwiej PHP) widzę stosowne tylko przy udostępnianiu zasobów, nie dla ich przygotowywania. W przeglądarce nie ma wystarczających możliwości, aby dało się dobrze przygotować zadanie dla serwera. Za to jest to doskonały sposób na przedstawienie zasobów "szerszej publiczności" gdyż nie muszą oni wtedy męczyć się z aplikacjami, których nie znają.
Poruszony też został problem przechowywania danych już na serwerze - trzeba dobrze przemyśleć, jak to ma działać, bo składowanie x-set tysięcy obrazów bez ładu i składu nie ma moim zdaniem sensu - to, gdzie dany skan ma trafić, musi być zdefiniowane przez użytkownika w momencie uploadu - żeby nie poleciał on do jakiegoś kąta, w którym nie powinien się w ogóle znaleźć - i żeby można go było odszukać wg jakichś kryteriów (te podejrzewam są już jakoś zdefiniowane - trzeba za to pamiętać, żeby zaimplementować te kryteria dla naszych potrzeb). Widzę tu tylko problem - do tych kryteriów pewnie ktoś, gdzieś ma jakieś prawa. Jeśli chcemy na poważnie opublikować ten system jako Open Source (trzeba też wybrać licencję - jest z czego wybierać), nie możemy sobie podłożyć jakiejś świni wykorzystując coś, co łamie nie tylko licencję tego, czego użyliśmy, ale także tej licencji, którą wybierzemy do tego projektu.
Przepraszam, że trochę sobie przywłaszczyłem projekt, pisząc, że coś czy czamtoś zrobimy "my" ale nie chcę pisać "wy", bo to chyba nie o to chodzi.
Pozdrawiam serdecznie i zapraszam do dyskusji