EPUB zu HTML Konverter
Konvertieren Sie EPUB E-Book-Dateien in das HTML-Format. Extrahieren Sie Buchinhalt, Metadaten, Kapitel und Bilder aus EPUB-Dateien zur Anzeige im Web oder zur weiteren Verarbeitung.
Eingabe
Ausgabe
| # | Dateiname | Aktionen |
|---|---|---|
| No data available | ||
Readme
Was ist eine EPUB-Datei?
EPUB (Electronic Publication) ist das am weitesten verbreitete offene Standardformat für digitale Bücher und Publikationen. Im Gegensatz zu PDF-Dateien, die feste Layouts beibehalten, sind EPUB-Dateien so konzipiert, dass sie reflowbar sind, d. h. der Text passt sich automatisch an verschiedene Bildschirmgrößen und Geräte an. Eine EPUB-Datei ist im Wesentlichen ein ZIP-Archiv, das XHTML- oder HTML-Inhalte, CSS-Stylesheets, Bilder und Metadatendateien enthält, die nach der EPUB-Spezifikation organisiert sind.
Das Format wurde vom International Digital Publishing Forum (IDPF) entwickelt und wird jetzt vom W3C verwaltet. EPUB-Dateien verwenden die Erweiterung .epub und werden von den meisten E-Readern, Tablets und Leseanwendungen unterstützt, darunter Apple Books, Google Play Books, Kobo und viele andere.
Werkzeugbeschreibung
Dieser Konverter extrahiert und transformiert EPUB-E-Book-Dateien in das Standard-HTML-Format. Er analysiert die EPUB-Paketstruktur, liest die Metadaten des Buches, verarbeitet alle Kapitel in ihrer korrekten Lesereihenfolge und generiert eine einzelne konsolidierte HTML-Datei, die in jedem Webbrowser angezeigt oder für andere Zwecke weiterverarbeitet werden kann.
Funktionsweise
Der Konverter verarbeitet EPUB-Dateien in mehreren Schritten:
- Entpacken: EPUB-Dateien sind ZIP-Archive, daher extrahiert das Tool zunächst den Inhalt
- OPF-Datei lokalisieren: Die Datei
META-INF/container.xmlverweist auf die OPF-Datei (Open Packaging Format), die das Manifest und die Lesereihenfolge des Buches enthält - Metadaten analysieren: Extrahiert Titel, Autor, Verlag, Sprache, Veröffentlichungsdatum und Beschreibung aus Dublin-Core-Metadatenelementen
- Spine verarbeiten: Der OPF-Spine definiert die Lesereihenfolge der Kapitel und stellt sicher, dass der Inhalt in der richtigen Reihenfolge angezeigt wird
- Inhalt extrahieren: Jede XHTML-Kapiteldatei wird verarbeitet und der Body-Inhalt extrahiert
- Bilder einbetten: Bilder werden in Base64-Daten-URIs konvertiert, damit sie direkt in das HTML eingebettet werden
- Stile einbinden: CSS-Stylesheets aus dem EPUB werden optional in die Ausgabe zusammengeführt
Funktionen
- Extrahiert vollständige Buchmetadaten einschließlich Titel, Autor, Verlag, Sprache und Beschreibung
- Behält die Kapitellesereihenfolge bei, wie sie im EPUB-Spine definiert ist
- Konvertiert eingebettete Bilder in Base64-Daten-URIs für eigenständige HTML-Ausgabe
- Bindet optional ursprüngliche CSS-Stylesheets aus dem EPUB ein
- Ermöglicht das Herunterladen einzelner Kapitel separat oder des kompletten Buches als einzelne HTML-Datei
Optionen erklärt
| Option | Beschreibung |
|---|---|
| Stile einbinden | Wenn aktiviert, extrahiert CSS-Stylesheets aus dem EPUB und bettet sie in das Ausgabe-HTML ein. Dies behält die ursprüngliche Formatierung und Typografie bei. Deaktivieren Sie diese Option für ungestylten Inhalt. |
| Bilder einbinden | Wenn aktiviert, konvertiert Bilder in Base64-Daten-URIs, die direkt in das HTML eingebettet werden. Die resultierende Datei ist eigenständig, aber größer. Deaktivieren Sie diese Option für reine Textausgabe. |
Anwendungsfälle
- Web-Publishing: Konvertieren Sie E-Books in HTML, um Auszüge oder vollständige Inhalte auf Websites zu veröffentlichen, ohne spezielle E-Book-Reader zu benötigen
- Inhaltsextraktion: Extrahieren Sie Text und Bilder aus EPUB-Dateien zum Bearbeiten, Umformatieren oder Importieren in andere Dokumentformate
- Archivierung und Sicherung: Erstellen Sie browserlesbare HTML-Versionen Ihrer E-Book-Bibliothek, die nicht von spezifischer Lesensoftware abhängen
Unterstützte Formate
| Eingabe | Ausgabe |
|---|---|
| EPUB 2.0 | HTML5 |
| EPUB 3.0 | HTML5 |
Einschränkungen
- DRM-geschützte EPUB-Dateien können nicht konvertiert werden. Das Tool funktioniert nur mit ungeschützten Dateien
- Sehr große EPUB-Dateien mit vielen hochauflösenden Bildern können länger verarbeitet werden
- Einige komplexe EPUB-3-Funktionen wie eingebettete Audio-/Videodateien, JavaScript-Interaktivität oder erweitertes CSS können möglicherweise nicht perfekt übertragen werden
- Fixed-Layout-EPUBs (häufig in Comics und Kinderbüchern) werden möglicherweise nicht wie beabsichtigt angezeigt, da das Tool für reflowbare Inhalte optimiert ist
Tipps
- Für die kleinste Ausgabedateigröße deaktivieren Sie beide Optionen „Stile einbinden" und „Bilder einbinden"
- Wenn Sie nur bestimmte Kapitel benötigen, verwenden Sie die Schaltflächen zum Herunterladen einzelner Kapitel anstelle des Herunterladens des kompletten Buches
- Das generierte HTML enthält semantisches Markup mit
<section>-Elementen für jedes Kapitel, was es einfach macht, benutzerdefinierte Stile anzuwenden oder den Inhalt weiter zu verarbeiten - Kapiteldateinamen werden als
data-source-Attribute beibehalten, was beim Identifizieren der Inhaltsquelle hilfreich ist
Häufig gestellte Fragen
F: Warum wird meine EPUB-Datei nicht konvertiert? A: Der häufigste Grund ist DRM-Schutz. EPUB-Dateien, die in einigen Geschäften gekauft werden, enthalten Kopierungsschutz, der die Konvertierung verhindert. Die Datei kann auch beschädigt sein oder nicht dem EPUB-Standard entsprechen.
F: Kann ich das HTML zurück in EPUB konvertieren? A: Dieses Tool konvertiert nur in eine Richtung (EPUB zu HTML). Um EPUB-Dateien aus HTML zu erstellen, benötigen Sie ein spezielles EPUB-Erstellungstool wie Calibre oder Sigil.
F: Warum fehlen einige Bilder in der Ausgabe? A: Bilder mit ungewöhnlichen Pfaden oder nicht standardisierten Formaten werden möglicherweise nicht korrekt verarbeitet. Stellen Sie sicher, dass die Option „Bilder einbinden" aktiviert ist. Einige EPUB-Dateien referenzieren externe Bilder über URLs, die nicht eingebettet werden können.