Informationen zum DjVu Dateiformat
DjVu (gesprochen: Déjà-Vu) ist ein speziell für gescannte Dokumente entwickeltes Bildkompressionsformat. Im Gegensatz zu PDF das besonders für Text und Vektorgrafik optimiert ist, speichert DJVU komprimierte Pixelbilder. Das ist ideal für Scans von Büchern, Zeitschriften oder historischen Dokumenten. Der größte Vorteil ist eine, verglichen mit PDF, besonders kleine Dateigröße. DjVu wurde zwischen 1996 und 2001 bei AT&T Labs entwickelt.
Wie funktioniert die Komprimierung bei DjVu-Dateien?
DjVu trennt jede Seite in Ebenen: Vordergrund (Text und Linien), Hintergrund (Papierstruktur und Bilder) und eine Maske. Jede Ebene wird mit einem eigenen, für diese Aufgabe optimierten, Algorithmus komprimiert:
Der Text wird mit dem JB2-Algorithmus verarbeitet. Dieser erkennt wiederkehrende Muster. So wird der Buchstabe „a“, sofern er in gleicher Schriftart und Größe wiederholt vorkommt, nur einmal gespeichert. Jedes weitere Vorkommen dieses Buchstabens wird fortan nur noch als Referenz gespeichert. Das spart erhebliche Mengen Speicherplatz ein. Die Hintergrundebene nutzt mit IW44 einen Wavelet-basierten Algorithmus, ähnlich JPEG 2000. Im Ergebnis können DjVu-Dateien 5-10x kleiner als PDF-Dateien mit vergleichbarer Qualität sein.
Geschichte und Verbreitung von DjVu
In den frühen 2000er Jahren galt DjVu als ernsthafter Konkurrent zu PDF. Das Million Book Project, eines der größten Digitalisierungsprojekte weltweit, nutzte DjVu ab 2002 als eines seiner Ausgabeformate. Auch Uni-Bibliotheken, Wikisource und einige wissenschaftliche Archive setzten auf DjVu. Die Hochphase endete etwa 2015 als Browser die Unterstützung für gewisse Plugins und Java-Applets einstellten. 2016 kündigte das Internet Archive schließlich an, keine neuen DjVu-Dateien mehr zu erzeugen, PDF hatte sich als Standard durchgesetzt.
Trotz des Rückgangs an neu erstellten DjVu-Dateien existieren immer noch Millionen DjVu-Dateien im Internet. Um diese Dateien ohne Umwege und mit hoher Qualität auf allen Geräten öffnen zu können, ist eine Konvertierung in PDF sinnvoll. Der einzige Nachteil ist die etwas größere Dateigröße nach der Umwandlung. Doch die etwas größere Dateigröße ist heute meist vertretbar.
Quellen
Archive.org: Diskussion über das Ende der DjVu-Erstellung
Archive.org: Rückblick auf 20 Jahre Million Book Project
Eldakar, Y., El Gammal, K., Adly, N. et al.: The Million Book Project at Bibliotheca Alexandrina. Journal of Zhejiang University-SCIENCE A 6(11), 1327–1340 (2005). https://doi.org/10.1631/jzus.2005.A1327
DjVu-Dateien umwandeln, öffnen und bearbeiten
Informationen zu DjVu-Dateien
- Software zum DjVu öffnen
- WinDjView Linux DjView
- Software zum DjVu bearbeiten
- MIME-Type für DjVu
- image/vnd.djvu
Keine Kommentare