Co to jest plik EPUB?

EPUB (Electronic Publication) to najpowszechniej używany otwarty standard formatu dla książek cyfrowych i publikacji. W przeciwieństwie do plików PDF, które utrzymują stałe układy, pliki EPUB są zaprojektowane jako reflowable, co oznacza, że tekst automatycznie dostosowuje się do różnych rozmiarów ekranu i urządzeń. Plik EPUB to zasadniczo archiwum ZIP zawierające zawartość XHTML lub HTML, arkusze stylów CSS, obrazy i pliki metadanych zorganizowane zgodnie ze specyfikacją EPUB.

Format został opracowany przez International Digital Publishing Forum (IDPF) i jest obecnie utrzymywany przez W3C. Pliki EPUB używają rozszerzenia .epub i są obsługiwane przez większość czytników e-booków, tabletów i aplikacji do czytania, w tym Apple Books, Google Play Books, Kobo i wiele innych.

Opis narzędzia

Ten konwerter ekstrahuje i transformuje pliki e-booków EPUB do standardowego formatu HTML. Analizuje strukturę pakietu EPUB, odczytuje metadane książki, przetwarza wszystkie rozdziały w prawidłowej kolejności czytania i generuje jeden skonsolidowany plik HTML, który można wyświetlić w dowolnej przeglądarce internetowej lub dalej przetwarzać do innych celów.

Jak to działa

Konwerter przetwarza pliki EPUB w kilku krokach:

  1. Rozpakowanie: Pliki EPUB to archiwa ZIP, więc narzędzie najpierw ekstrahuje zawartość
  2. Lokalizacja pliku OPF: Plik META-INF/container.xml wskazuje na plik OPF (Open Packaging Format), który zawiera manifest książki i kolejność czytania
  3. Analiza metadanych: Ekstrahuje tytuł, autora, wydawcę, język, datę publikacji i opis z elementów metadanych Dublin Core
  4. Przetwarzanie spine: Spine OPF definiuje kolejność czytania rozdziałów, zapewniając, że zawartość pojawia się w prawidłowej sekwencji
  5. Ekstrakcja zawartości: Każdy plik rozdziału XHTML jest przetwarzany, ekstrahując zawartość body
  6. Osadzanie obrazów: Obrazy są konwertowane na Base64 data URIs, aby były osadzone bezpośrednio w HTML
  7. Dołączanie stylów: Arkusze stylów CSS z EPUB są opcjonalnie scalane z wyjściem

Funkcje

  • Ekstrahuje pełne metadane książki, w tym tytuł, autora, wydawcę, język i opis
  • Zachowuje kolejność czytania rozdziałów zdefiniowaną w spine EPUB
  • Konwertuje osadzone obrazy na Base64 data URIs dla samodzielnego wyjścia HTML
  • Opcjonalnie dołącza oryginalne style CSS z EPUB
  • Umożliwia pobieranie poszczególnych rozdziałów oddzielnie lub całej książki jako jeden plik HTML

Wyjaśnienie opcji

Opcja Opis
Dołącz style Po włączeniu ekstrahuje arkusze stylów CSS z EPUB i osadza je w wyjściowym HTML. Zachowuje oryginalne formatowanie i typografię. Wyłącz, aby uzyskać zwykłą, niestyizowaną zawartość.
Dołącz obrazy Po włączeniu konwertuje obrazy na Base64 data URIs osadzone bezpośrednio w HTML. Wynikowy plik jest samodzielny, ale większy. Wyłącz, aby uzyskać wyjście tylko tekstowe.

Przypadki użycia

  • Publikowanie w sieci: Konwertuj e-booki do HTML w celu publikowania fragmentów lub pełnej zawartości na stronach internetowych bez konieczności używania specjalnych czytników e-booków
  • Ekstrakcja zawartości: Ekstrahuj tekst i obrazy z plików EPUB do edycji, przeformatowania lub importu do innych formatów dokumentów
  • Archiwizacja i kopia zapasowa: Utwórz wersje HTML czytelne w przeglądarce swojej biblioteki e-booków, które nie zależą od konkretnego oprogramowania do czytania

Obsługiwane formaty

Wejście Wyjście
EPUB 2.0 HTML5
EPUB 3.0 HTML5

Ograniczenia

  • Pliki EPUB chronione DRM nie mogą być konwertowane. Narzędzie działa tylko z plikami niezabezpieczonymi
  • Bardzo duże pliki EPUB z wieloma obrazami o wysokiej rozdzielczości mogą trwać dłużej
  • Niektóre zaawansowane funkcje EPUB 3, takie jak osadzone audio/wideo, interaktywność JavaScript lub zaawansowany CSS, mogą nie przenieść się idealnie
  • EPUB-y o stałym układzie (powszechne w komiksach i książkach dla dzieci) mogą nie wyświetlać się zgodnie z przeznaczeniem, ponieważ narzędzie jest zoptymalizowane dla zawartości reflowable

Porady

  • Aby uzyskać najmniejszy rozmiar pliku wyjściowego, wyłącz obie opcje "Dołącz style" i "Dołącz obrazy"
  • Jeśli potrzebujesz tylko określonych rozdziałów, użyj przycisków pobierania poszczególnych rozdziałów zamiast pobierać całą książkę
  • Wygenerowany HTML zawiera semantyczne znaczniki z elementami <section> dla każdego rozdziału, ułatwiając zastosowanie niestandardowych stylów lub dalsze przetwarzanie zawartości
  • Nazwy plików rozdziałów są zachowywane jako atrybuty data-source, pomocne do identyfikacji źródła zawartości

FAQ

P: Dlaczego mój plik EPUB nie jest konwertowany? O: Najczęstszą przyczyną jest ochrona DRM. Pliki EPUB zakupione w niektórych sklepach zawierają ochronę przed kopiowaniem, która uniemożliwia konwersję. Plik może być również uszkodzony lub nie być zgodny ze standardem EPUB.

P: Czy mogę przekonwertować HTML z powrotem na EPUB? O: To narzędzie konwertuje tylko w jednym kierunku (EPUB do HTML). Do tworzenia plików EPUB z HTML potrzebujesz dedykowanego narzędzia do tworzenia EPUB, takiego jak Calibre lub Sigil.

P: Dlaczego w wyjściu brakuje niektórych obrazów? O: Obrazy o niezwykłych ścieżkach lub niestandardowych formatach mogą nie być przetwarzane prawidłowo. Upewnij się, że opcja "Dołącz obrazy" jest włączona. Niektóre pliki EPUB odwołują się do obrazów zewnętrznych za pośrednictwem adresów URL, których nie można osadzić.