EPUB към HTML конвертор
Конвертирайте EPUB файлове на електронни книги в HTML формат. Извличайте съдържание на книги, метаданни, глави и изображения от EPUB файлове за преглед в уеб или допълнителна обработка.
Вход
Изход
| # | Име на файл | Действия |
|---|---|---|
| No data available | ||
Прочети ме
Какво е EPUB файл?
EPUB (Electronic Publication) е най-широко използваният отворен стандартен формат за цифрови книги и публикации. За разлика от PDF файловете, които поддържат фиксирани оформления, EPUB файловете са проектирани да бъдат преформатируеми, което означава, че текстът автоматично се приспособява към различни размери на екрана и устройства. EPUB файлът е по същество ZIP архив, съдържащ XHTML или HTML съдържание, CSS таблици със стилове, изображения и файлове с метаданни, организирани според спецификацията на EPUB.
Форматът е разработен от Международния форум за цифрово издаване (IDPF) и в момента се поддържа от W3C. EPUB файловете използват разширението .epub и се поддържат от повечето електронни четци, таблети и приложения за четене, включително Apple Books, Google Play Books, Kobo и много други.
Описание на инструмента
Този конвертор извлича и трансформира EPUB файлове на електронни книги в стандартния HTML формат. Той анализира структурата на EPUB пакета, чете метаданните на книгата, обработва всички глави в правилния им ред на четене и генерира един единствен консолидиран HTML файл, който може да се преглежда в любой уеб браузър или да се обработва допълнително за други цели.
Как работи
Конвертора обработва EPUB файлове чрез няколко стъпки:
- Разархивиране: EPUB файловете са ZIP архиви, така че инструментът първо извлича съдържанието
- Намиране на OPF файла: Файлът
META-INF/container.xmlсочи към OPF (Open Packaging Format) файла, който съдържа манифеста и реда на четене на книгата - Анализ на метаданните: Извлича заглавие, автор, издател, език, дата на публикуване и описание от елементите на метаданни на Dublin Core
- Обработка на spine: OPF spine определя реда на четене на главите, гарантирайки, че съдържанието се появява в правилната последователност
- Извличане на съдържание: Всеки XHTML файл на глава се обработва, като се извлича съдържанието на body
- Вграждане на изображения: Изображенията се преобразуват в Base64 data URIs, така че да бъдат вградени директно в HTML
- Включване на стилове: CSS таблиците със стилове от EPUB могат по избор да бъдат обединени в резултата
Функции
- Извлича пълни метаданни на книгата, включително заглавие, автор, издател, език и описание
- Запазва реда на четене на главите, както е определено в EPUB spine
- Преобразува вградени изображения в Base64 data URIs за самостоятелен HTML резултат
- По избор включва оригиналните CSS стилове от EPUB
- Позволява изтегляне на отделни глави или на цялата книга като един HTML файл
Обяснение на опциите
| Опция | Описание |
|---|---|
| Включване на стилове | Когато е активирано, извлича CSS таблиците със стилове от EPUB и ги вгражда в резултатния HTML. Това запазва оригиналното форматиране и типография. Деактивирайте за обикновено съдържание без стилове. |
| Включване на изображения | Когато е активирано, преобразува изображенията в Base64 data URIs, вградени директно в HTML. Резултатният файл е самостоятелен, но по-голям. Деактивирайте за резултат само с текст. |
Случаи на употреба
- Уеб издаване: Преобразуване на електронни книги в HTML за публикуване на откъси или пълно съдържание на уебсайтове без необходимост от специални четци за електронни книги
- Извличане на съдържание: Извличане на текст и изображения от EPUB файлове за редактиране, преформатиране или импортиране в други формати на документи
- Архивиране и резервно копие: Създаване на браузър-четими HTML версии на вашата библиотека с електронни книги, които не зависят от специфичен софтуер за четене
Поддържани формати
| Вход | Изход |
|---|---|
| EPUB 2.0 | HTML5 |
| EPUB 3.0 | HTML5 |
Ограничения
- DRM-защитени EPUB файлове не могат да бъдат преобразувани. Инструментът работи само с незащитени файлове
- Много големи EPUB файлове с много изображения с висока разделителна способност могат да отнемат повече време за обработка
- Някои сложни функции на EPUB 3, като вградено аудио/видео, JavaScript интерактивност или напреднали CSS, може да не се прехвърлят перфектно
- EPUB файлове с фиксирано оформление (често срещани в комикси и детски книги) може да не се показват както е предвидено, тъй като инструментът е оптимизиран за преформатируемо съдържание
Съвети
- За най-малкия размер на резултатния файл, деактивирайте и двете опции "Включване на стилове" и "Включване на изображения"
- Ако имате нужда само от конкретни глави, използвайте бутоните за изтегляне на отделни глави вместо да изтегляте цялата книга
- Генерираният HTML включва семантично маркиране с елементи
<section>за всяка глава, което улеснява прилагането на персонализирани стилове или допълнителна обработка на съдържанието - Имената на файловете на главите се запазват като атрибути
data-source, което е полезно за идентифициране на произхода на съдържанието
ЧЗВ
В: Защо моят EPUB файл не се преобразува? О: Най-честата причина е DRM защита. EPUB файлове, закупени от някои магазини, включват защита от копиране, която предотвратява преобразуването. Файлът може също да е повреден или да не следва правилно стандарта EPUB.
В: Мога ли да преобразувам HTML обратно в EPUB? О: Този инструмент преобразува само в една посока (EPUB в HTML). За създаване на EPUB файлове от HTML, ще имате нужда от специализиран инструмент за създаване на EPUB, като Calibre или Sigil.
В: Защо някои изображения липсват в резултата? О: Изображенията с необичайни пътища или нестандартни формати може да не се обработят правилно. Уверете се, че опцията "Включване на изображения" е активирана. Някои EPUB файлове препращат към външни изображения чрез URL адреси, които не могат да бъдат вградени.