EPUBファイルとは?

EPUB(Electronic Publication)は、デジタル書籍と出版物に最も広く使用されているオープンスタンダード形式です。固定レイアウトを維持するPDFファイルとは異なり、EPUBファイルはリフロー可能に設計されています。つまり、テキストが異なる画面サイズとデバイスに自動的に調整されます。EPUBファイルは本質的には、EPUB仕様に従って整理されたXHTMLまたはHTMLコンテンツ、CSSスタイルシート、画像、メタデータファイルを含むZIPアーカイブです。

この形式は国際デジタル出版フォーラム(IDPF)によって開発され、現在はW3Cによって保守されています。EPUBファイルは.epub拡張子を使用し、Apple Books、Google Play Books、Koboを含むほとんどの電子リーダー、タブレット、読書アプリケーションでサポートされています。

ツール説明

このコンバーターは、EPUBの電子書籍ファイルを標準HTML形式に抽出および変換します。EPUBパッケージ構造を解析し、書籍のメタデータを読み取り、すべての章を正しい読む順序で処理し、任意のウェブブラウザで表示したり、他の目的でさらに処理したりできる単一の統合HTMLファイルを生成します。

動作方法

コンバーターはEPUBファイルを複数のステップで処理します:

  1. 解凍: EPUBファイルはZIPアーカイブであるため、ツールはまずコンテンツを抽出します
  2. OPFファイルの検索: META-INF/container.xmlファイルは、書籍のマニフェストと読む順序を含むOPF(Open Packaging Format)ファイルを指します
  3. メタデータの解析: Dublin Coreメタデータ要素からタイトル、著者、出版社、言語、出版日、説明を抽出します
  4. スパインの処理: OPFスパインは章の読む順序を定義し、コンテンツが正しい順序で表示されることを保証します
  5. コンテンツの抽出: 各XHTMLチャプターファイルが処理され、本文コンテンツが抽出されます
  6. 画像の埋め込み: 画像がBase64データURIに変換され、HTMLに直接埋め込まれます
  7. スタイルの含有: EPUBのCSSスタイルシートはオプションで出力にマージされます

機能

  • タイトル、著者、出版社、言語、説明を含む完全な書籍メタデータを抽出
  • EPUBスパインで定義されている章の読む順序を保持
  • 埋め込み画像をBase64データURIに変換して、自己完結型のHTML出力を実現
  • オプションでEPUBからのオリジナルCSSスタイルを含有
  • 個別の章を個別にダウンロードするか、完全な書籍を単一のHTMLファイルとしてダウンロード可能

オプション説明

オプション 説明
スタイルを含める 有効にすると、EPUBからCSSスタイルシートを抽出し、出力HTMLに埋め込みます。これにより、オリジナルのフォーマットとタイポグラフィが保持されます。プレーンで無装飾のコンテンツの場合は無効にしてください。
画像を含める 有効にすると、画像がBase64データURIに変換され、HTMLに直接埋め込まれます。結果のファイルは自己完結していますが、サイズが大きくなります。テキストのみの出力の場合は無効にしてください。

ユースケース

  • ウェブ出版: 電子書籍をHTMLに変換して、特別な電子書籍リーダーを必要とせずにウェブサイトで抜粋または完全なコンテンツを公開
  • コンテンツ抽出: EPUBファイルからテキストと画像を抽出して、編集、再フォーマット、または他のドキュメント形式へのインポート
  • アーカイブとバックアップ: 特定の読書ソフトウェアに依存しない、ブラウザで読める電子書籍ライブラリのHTMLバージョンを作成

サポートされている形式

入力 出力
EPUB 2.0 HTML5
EPUB 3.0 HTML5

制限事項

  • DRM保護されたEPUBファイルは変換できません。ツールは保護されていないファイルのみで動作します
  • 多くの高解像度画像を含む非常に大きなEPUBファイルは、処理に時間がかかる場合があります
  • 埋め込みオーディオ/ビデオ、JavaScriptインタラクティビティ、高度なCSSなど、一部の複雑なEPUB 3機能は完全には転送されない場合があります
  • 固定レイアウトEPUB(コミックと児童書で一般的)は、ツールがリフロー可能なコンテンツに最適化されているため、意図したとおりに表示されない場合があります

ヒント

  • 最小の出力ファイルサイズの場合、「スタイルを含める」と「画像を含める」の両方のオプションを無効にしてください
  • 特定の章のみが必要な場合は、完全な書籍をダウンロードする代わりに、個別の章ダウンロードボタンを使用してください
  • 生成されたHTMLには、各章の<section>要素を含むセマンティックマークアップが含まれており、カスタムスタイルを適用したり、コンテンツをさらに処理したりするのが簡単です
  • 章のファイル名はdata-source属性として保持され、コンテンツの出所を特定するのに役立ちます

よくある質問

Q: EPUBファイルが変換されないのはなぜですか? A: 最も一般的な理由はDRM保護です。一部のストアから購入したEPUBファイルには、変換を防止するコピー保護が含まれています。ファイルが破損しているか、EPUB標準に正しく従っていない可能性もあります。

Q: HTMLをEPUBに変換し直すことはできますか? A: このツールは一方向のみで変換します(EPUBからHTML)。HTMLからEPUBファイルを作成するには、CalibreやSigilなどの専用EPUB作成ツールが必要です。

Q: 出力で一部の画像が見つからないのはなぜですか? A: 異常なパスまたは非標準形式の画像は、正しく処理されない場合があります。「画像を含める」オプションが有効になっていることを確認してください。一部のEPUBファイルはURLを介して外部画像を参照しており、埋め込むことができません。