Какво е EPUB файл?

EPUB (Electronic Publication) е най-широко използваният отворен стандартен формат за цифрови книги и публикации. За разлика от PDF файловете, които поддържат фиксирани оформления, EPUB файловете са проектирани да бъдат преформатируеми, което означава, че текстът автоматично се приспособява към различни размери на екрана и устройства. EPUB файлът е по същество ZIP архив, съдържащ XHTML или HTML съдържание, CSS таблици със стилове, изображения и файлове с метаданни, организирани според спецификацията на EPUB.

Форматът е разработен от Международния форум за цифрово издаване (IDPF) и в момента се поддържа от W3C. EPUB файловете използват разширението .epub и се поддържат от повечето електронни четци, таблети и приложения за четене, включително Apple Books, Google Play Books, Kobo и много други.

Описание на инструмента

Този конвертор извлича и трансформира EPUB файлове на електронни книги в стандартния HTML формат. Той анализира структурата на EPUB пакета, чете метаданните на книгата, обработва всички глави в правилния им ред на четене и генерира един единствен консолидиран HTML файл, който може да се преглежда в любой уеб браузър или да се обработва допълнително за други цели.

Как работи

Конвертора обработва EPUB файлове чрез няколко стъпки:

  1. Разархивиране: EPUB файловете са ZIP архиви, така че инструментът първо извлича съдържанието
  2. Намиране на OPF файла: Файлът META-INF/container.xml сочи към OPF (Open Packaging Format) файла, който съдържа манифеста и реда на четене на книгата
  3. Анализ на метаданните: Извлича заглавие, автор, издател, език, дата на публикуване и описание от елементите на метаданни на Dublin Core
  4. Обработка на spine: OPF spine определя реда на четене на главите, гарантирайки, че съдържанието се появява в правилната последователност
  5. Извличане на съдържание: Всеки XHTML файл на глава се обработва, като се извлича съдържанието на body
  6. Вграждане на изображения: Изображенията се преобразуват в Base64 data URIs, така че да бъдат вградени директно в HTML
  7. Включване на стилове: CSS таблиците със стилове от EPUB могат по избор да бъдат обединени в резултата

Функции

  • Извлича пълни метаданни на книгата, включително заглавие, автор, издател, език и описание
  • Запазва реда на четене на главите, както е определено в EPUB spine
  • Преобразува вградени изображения в Base64 data URIs за самостоятелен HTML резултат
  • По избор включва оригиналните CSS стилове от EPUB
  • Позволява изтегляне на отделни глави или на цялата книга като един HTML файл

Обяснение на опциите

Опция Описание
Включване на стилове Когато е активирано, извлича CSS таблиците със стилове от EPUB и ги вгражда в резултатния HTML. Това запазва оригиналното форматиране и типография. Деактивирайте за обикновено съдържание без стилове.
Включване на изображения Когато е активирано, преобразува изображенията в Base64 data URIs, вградени директно в HTML. Резултатният файл е самостоятелен, но по-голям. Деактивирайте за резултат само с текст.

Случаи на употреба

  • Уеб издаване: Преобразуване на електронни книги в HTML за публикуване на откъси или пълно съдържание на уебсайтове без необходимост от специални четци за електронни книги
  • Извличане на съдържание: Извличане на текст и изображения от EPUB файлове за редактиране, преформатиране или импортиране в други формати на документи
  • Архивиране и резервно копие: Създаване на браузър-четими HTML версии на вашата библиотека с електронни книги, които не зависят от специфичен софтуер за четене

Поддържани формати

Вход Изход
EPUB 2.0 HTML5
EPUB 3.0 HTML5

Ограничения

  • DRM-защитени EPUB файлове не могат да бъдат преобразувани. Инструментът работи само с незащитени файлове
  • Много големи EPUB файлове с много изображения с висока разделителна способност могат да отнемат повече време за обработка
  • Някои сложни функции на EPUB 3, като вградено аудио/видео, JavaScript интерактивност или напреднали CSS, може да не се прехвърлят перфектно
  • EPUB файлове с фиксирано оформление (често срещани в комикси и детски книги) може да не се показват както е предвидено, тъй като инструментът е оптимизиран за преформатируемо съдържание

Съвети

  • За най-малкия размер на резултатния файл, деактивирайте и двете опции "Включване на стилове" и "Включване на изображения"
  • Ако имате нужда само от конкретни глави, използвайте бутоните за изтегляне на отделни глави вместо да изтегляте цялата книга
  • Генерираният HTML включва семантично маркиране с елементи <section> за всяка глава, което улеснява прилагането на персонализирани стилове или допълнителна обработка на съдържанието
  • Имената на файловете на главите се запазват като атрибути data-source, което е полезно за идентифициране на произхода на съдържанието

ЧЗВ

В: Защо моят EPUB файл не се преобразува? О: Най-честата причина е DRM защита. EPUB файлове, закупени от някои магазини, включват защита от копиране, която предотвратява преобразуването. Файлът може също да е повреден или да не следва правилно стандарта EPUB.

В: Мога ли да преобразувам HTML обратно в EPUB? О: Този инструмент преобразува само в една посока (EPUB в HTML). За създаване на EPUB файлове от HTML, ще имате нужда от специализиран инструмент за създаване на EPUB, като Calibre или Sigil.

В: Защо някои изображения липсват в резултата? О: Изображенията с необичайни пътища или нестандартни формати може да не се обработят правилно. Уверете се, че опцията "Включване на изображения" е активирана. Някои EPUB файлове препращат към външни изображения чрез URL адреси, които не могат да бъдат вградени.