Was ist eine EPUB-Datei?

EPUB (Electronic Publication) ist das am weitesten verbreitete offene Standardformat für digitale Bücher und Publikationen. Im Gegensatz zu PDF-Dateien, die feste Layouts beibehalten, sind EPUB-Dateien so konzipiert, dass sie reflowbar sind, d. h. der Text passt sich automatisch an verschiedene Bildschirmgrößen und Geräte an. Eine EPUB-Datei ist im Wesentlichen ein ZIP-Archiv, das XHTML- oder HTML-Inhalte, CSS-Stylesheets, Bilder und Metadatendateien enthält, die nach der EPUB-Spezifikation organisiert sind.

Das Format wurde vom International Digital Publishing Forum (IDPF) entwickelt und wird jetzt vom W3C verwaltet. EPUB-Dateien verwenden die Erweiterung .epub und werden von den meisten E-Readern, Tablets und Leseanwendungen unterstützt, darunter Apple Books, Google Play Books, Kobo und viele andere.

Werkzeugbeschreibung

Dieser Konverter extrahiert und transformiert EPUB-E-Book-Dateien in das Standard-HTML-Format. Er analysiert die EPUB-Paketstruktur, liest die Metadaten des Buches, verarbeitet alle Kapitel in ihrer korrekten Lesereihenfolge und generiert eine einzelne konsolidierte HTML-Datei, die in jedem Webbrowser angezeigt oder für andere Zwecke weiterverarbeitet werden kann.

Funktionsweise

Der Konverter verarbeitet EPUB-Dateien in mehreren Schritten:

  1. Entpacken: EPUB-Dateien sind ZIP-Archive, daher extrahiert das Tool zunächst den Inhalt
  2. OPF-Datei lokalisieren: Die Datei META-INF/container.xml verweist auf die OPF-Datei (Open Packaging Format), die das Manifest und die Lesereihenfolge des Buches enthält
  3. Metadaten analysieren: Extrahiert Titel, Autor, Verlag, Sprache, Veröffentlichungsdatum und Beschreibung aus Dublin-Core-Metadatenelementen
  4. Spine verarbeiten: Der OPF-Spine definiert die Lesereihenfolge der Kapitel und stellt sicher, dass der Inhalt in der richtigen Reihenfolge angezeigt wird
  5. Inhalt extrahieren: Jede XHTML-Kapiteldatei wird verarbeitet und der Body-Inhalt extrahiert
  6. Bilder einbetten: Bilder werden in Base64-Daten-URIs konvertiert, damit sie direkt in das HTML eingebettet werden
  7. Stile einbinden: CSS-Stylesheets aus dem EPUB werden optional in die Ausgabe zusammengeführt

Funktionen

  • Extrahiert vollständige Buchmetadaten einschließlich Titel, Autor, Verlag, Sprache und Beschreibung
  • Behält die Kapitellesereihenfolge bei, wie sie im EPUB-Spine definiert ist
  • Konvertiert eingebettete Bilder in Base64-Daten-URIs für eigenständige HTML-Ausgabe
  • Bindet optional ursprüngliche CSS-Stylesheets aus dem EPUB ein
  • Ermöglicht das Herunterladen einzelner Kapitel separat oder des kompletten Buches als einzelne HTML-Datei

Optionen erklärt

Option Beschreibung
Stile einbinden Wenn aktiviert, extrahiert CSS-Stylesheets aus dem EPUB und bettet sie in das Ausgabe-HTML ein. Dies behält die ursprüngliche Formatierung und Typografie bei. Deaktivieren Sie diese Option für ungestylten Inhalt.
Bilder einbinden Wenn aktiviert, konvertiert Bilder in Base64-Daten-URIs, die direkt in das HTML eingebettet werden. Die resultierende Datei ist eigenständig, aber größer. Deaktivieren Sie diese Option für reine Textausgabe.

Anwendungsfälle

  • Web-Publishing: Konvertieren Sie E-Books in HTML, um Auszüge oder vollständige Inhalte auf Websites zu veröffentlichen, ohne spezielle E-Book-Reader zu benötigen
  • Inhaltsextraktion: Extrahieren Sie Text und Bilder aus EPUB-Dateien zum Bearbeiten, Umformatieren oder Importieren in andere Dokumentformate
  • Archivierung und Sicherung: Erstellen Sie browserlesbare HTML-Versionen Ihrer E-Book-Bibliothek, die nicht von spezifischer Lesensoftware abhängen

Unterstützte Formate

Eingabe Ausgabe
EPUB 2.0 HTML5
EPUB 3.0 HTML5

Einschränkungen

  • DRM-geschützte EPUB-Dateien können nicht konvertiert werden. Das Tool funktioniert nur mit ungeschützten Dateien
  • Sehr große EPUB-Dateien mit vielen hochauflösenden Bildern können länger verarbeitet werden
  • Einige komplexe EPUB-3-Funktionen wie eingebettete Audio-/Videodateien, JavaScript-Interaktivität oder erweitertes CSS können möglicherweise nicht perfekt übertragen werden
  • Fixed-Layout-EPUBs (häufig in Comics und Kinderbüchern) werden möglicherweise nicht wie beabsichtigt angezeigt, da das Tool für reflowbare Inhalte optimiert ist

Tipps

  • Für die kleinste Ausgabedateigröße deaktivieren Sie beide Optionen „Stile einbinden" und „Bilder einbinden"
  • Wenn Sie nur bestimmte Kapitel benötigen, verwenden Sie die Schaltflächen zum Herunterladen einzelner Kapitel anstelle des Herunterladens des kompletten Buches
  • Das generierte HTML enthält semantisches Markup mit <section>-Elementen für jedes Kapitel, was es einfach macht, benutzerdefinierte Stile anzuwenden oder den Inhalt weiter zu verarbeiten
  • Kapiteldateinamen werden als data-source-Attribute beibehalten, was beim Identifizieren der Inhaltsquelle hilfreich ist

Häufig gestellte Fragen

F: Warum wird meine EPUB-Datei nicht konvertiert? A: Der häufigste Grund ist DRM-Schutz. EPUB-Dateien, die in einigen Geschäften gekauft werden, enthalten Kopierungsschutz, der die Konvertierung verhindert. Die Datei kann auch beschädigt sein oder nicht dem EPUB-Standard entsprechen.

F: Kann ich das HTML zurück in EPUB konvertieren? A: Dieses Tool konvertiert nur in eine Richtung (EPUB zu HTML). Um EPUB-Dateien aus HTML zu erstellen, benötigen Sie ein spezielles EPUB-Erstellungstool wie Calibre oder Sigil.

F: Warum fehlen einige Bilder in der Ausgabe? A: Bilder mit ungewöhnlichen Pfaden oder nicht standardisierten Formaten werden möglicherweise nicht korrekt verarbeitet. Stellen Sie sicher, dass die Option „Bilder einbinden" aktiviert ist. Einige EPUB-Dateien referenzieren externe Bilder über URLs, die nicht eingebettet werden können.