EPUB फ़ाइल क्या है?

EPUB (Electronic Publication) डिजिटल पुस्तकों और प्रकाशनों के लिए सबसे व्यापक रूप से उपयोग किया जाने वाला खुला मानक प्रारूप है। PDF फ़ाइलों के विपरीत जो निश्चित लेआउट बनाए रखती हैं, EPUB फ़ाइलें reflowable होने के लिए डिज़ाइन की गई हैं, जिसका अर्थ है कि पाठ विभिन्न स्क्रीन आकारों और डिवाइसों के अनुरूप स्वचालित रूप से समायोजित होता है। एक EPUB फ़ाइल अनिवार्य रूप से एक ZIP संग्रह है जिसमें XHTML या HTML सामग्री, CSS स्टाइलशीट, छवियां, और EPUB विनिर्देश के अनुसार संगठित मेटाडेटा फ़ाइलें हैं।

यह प्रारूप International Digital Publishing Forum (IDPF) द्वारा विकसित किया गया था और अब W3C द्वारा बनाए रखा जाता है। EPUB फ़ाइलें .epub एक्सटेंशन का उपयोग करती हैं और Apple Books, Google Play Books, Kobo, और कई अन्य सहित अधिकांश ई-रीडर्स, टैबलेट, और पढ़ने वाली एप्लिकेशनों द्वारा समर्थित हैं।

उपकरण विवरण

यह कनवर्टर EPUB ई-बुक फ़ाइलों को निकालता है और उन्हें मानक HTML प्रारूप में रूपांतरित करता है। यह EPUB पैकेज संरचना को पार्स करता है, पुस्तक के मेटाडेटा को पढ़ता है, सभी अध्यायों को उनके सही पढ़ने के क्रम में संसाधित करता है, और एक एकल समेकित HTML फ़ाइल उत्पन्न करता है जिसे किसी भी वेब ब्राउज़र में देखा जा सकता है या अन्य उद्देश्यों के लिए आगे संसाधित किया जा सकता है।

यह कैसे काम करता है

कनवर्टर EPUB फ़ाइलों को कई चरणों के माध्यम से संसाधित करता है:

  1. Unzipping: EPUB फ़ाइलें ZIP संग्रह हैं, इसलिए उपकरण पहले सामग्री को निकालता है
  2. OPF फ़ाइल का पता लगाना: META-INF/container.xml फ़ाइल OPF (Open Packaging Format) फ़ाइल की ओर इशारा करती है जिसमें पुस्तक की manifest और पढ़ने का क्रम होता है
  3. मेटाडेटा को पार्स करना: Dublin Core मेटाडेटा तत्वों से शीर्षक, लेखक, प्रकाशक, भाषा, प्रकाशन तिथि, और विवरण निकालता है
  4. Spine को संसाधित करना: OPF spine अध्यायों के पढ़ने का क्रम परिभाषित करता है, यह सुनिश्चित करता है कि सामग्री सही क्रम में दिखाई दे
  5. सामग्री निकालना: प्रत्येक XHTML अध्याय फ़ाइल को संसाधित किया जाता है, body सामग्री को निकाला जाता है
  6. छवियों को एम्बेड करना: छवियों को Base64 data URIs में परिवर्तित किया जाता है ताकि वे सीधे HTML में एम्बेड हों
  7. शैलियों को शामिल करना: EPUB से CSS स्टाइलशीट को वैकल्पिक रूप से आउटपुट में मर्ज किया जाता है

विशेषताएं

  • शीर्षक, लेखक, प्रकाशक, भाषा, और विवरण सहित संपूर्ण पुस्तक मेटाडेटा निकालता है
  • EPUB spine में परिभाषित अध्याय पढ़ने के क्रम को संरक्षित करता है
  • एम्बेड की गई छवियों को Base64 data URIs में परिवर्तित करता है जो सीधे HTML में एम्बेड होती हैं
  • आउटपुट HTML में मूल CSS शैलियों को वैकल्पिक रूप से शामिल करता है
  • व्यक्तिगत अध्यायों को अलग से या संपूर्ण पुस्तक को एकल HTML फ़ाइल के रूप में डाउनलोड करने की अनुमति देता है

विकल्पों की व्याख्या

विकल्प विवरण
शैलियों को शामिल करें जब सक्षम किया जाता है, तो EPUB से CSS स्टाइलशीट निकालता है और उन्हें आउटपुट HTML में एम्बेड करता है। यह मूल स्वरूपण और टाइपोग्राफी को संरक्षित करता है। सादी, बिना शैली वाली सामग्री के लिए अक्षम करें।
छवियों को शामिल करें जब सक्षम किया जाता है, तो छवियों को Base64 data URIs में परिवर्तित करता है जो सीधे HTML में एम्बेड होती हैं। परिणामी फ़ाइल स्वतंत्र है लेकिन बड़ी है। केवल पाठ आउटपुट के लिए अक्षम करें।

उपयोग के मामले

  • वेब प्रकाशन: विशेष ई-बुक रीडर की आवश्यकता के बिना वेबसाइटों पर अंश या पूर्ण सामग्री प्रकाशित करने के लिए ई-बुक को HTML में परिवर्तित करें
  • सामग्री निष्कर्षण: संपादन, पुनः स्वरूपण, या अन्य दस्तावेज़ प्रारूपों में आयात करने के लिए EPUB फ़ाइलों से पाठ और छवियां निकालें
  • संग्रह और बैकअप: अपनी ई-बुक लाइब्रेरी के ब्राउज़र-पठनीय HTML संस्करण बनाएं जो विशिष्ट पढ़ने वाले सॉफ़्टवेयर पर निर्भर नहीं हैं

समर्थित प्रारूप

इनपुट आउटपुट
EPUB 2.0 HTML5
EPUB 3.0 HTML5

सीमाएं

  • DRM-सुरक्षित EPUB फ़ाइलें परिवर्तित नहीं की जा सकतीं। उपकरण केवल असुरक्षित फ़ाइलों के साथ काम करता है
  • कई उच्च-रिज़ॉल्यूशन छवियों वाली बहुत बड़ी EPUB फ़ाइलें संसाधित होने में अधिक समय ले सकती हैं
  • कुछ जटिल EPUB 3 विशेषताएं जैसे एम्बेड किया गया ऑडियो/वीडियो, JavaScript इंटरैक्टिविटी, या उन्नत CSS पूरी तरह से स्थानांतरित नहीं हो सकती हैं
  • Fixed-layout EPUBs (कॉमिक्स और बच्चों की किताबों में सामान्य) इच्छानुसार प्रदर्शित नहीं हो सकते हैं क्योंकि उपकरण reflowable सामग्री के लिए अनुकूलित है

सुझाव

  • सबसे छोटी आउटपुट फ़ाइल आकार के लिए, "शैलियों को शामिल करें" और "छवियों को शामिल करें" दोनों विकल्पों को अक्षम करें
  • यदि आपको केवल विशिष्ट अध्यायों की आवश्यकता है, तो संपूर्ण पुस्तक डाउनलोड करने के बजाय व्यक्तिगत अध्याय डाउनलोड बटन का उपयोग करें
  • उत्पन्न HTML में प्रत्येक अध्याय के लिए <section> तत्वों के साथ semantic markup शामिल है, जिससे कस्टम शैलीकरण लागू करना या सामग्री को आगे संसाधित करना आसान हो जाता है
  • अध्याय फ़ाइलनामें data-source विशेषताओं के रूप में संरक्षित हैं, सामग्री मूल की पहचान करने में सहायक

FAQ

प्रश्न: मेरी EPUB फ़ाइल परिवर्तित क्यों नहीं हो रही है? उत्तर: सबसे आम कारण DRM सुरक्षा है। कुछ स्टोर से खरीदी गई EPUB फ़ाइलों में कॉपी सुरक्षा शामिल होती है जो परिवर्तन को रोकती है। फ़ाइल भ्रष्ट हो सकती है या EPUB मानक का सही तरीके से पालन नहीं कर सकती है।

प्रश्न: क्या मैं HTML को वापस EPUB में परिवर्तित कर सकता हूं? उत्तर: यह उपकरण केवल एक दिशा में परिवर्तित करता है (EPUB से HTML)। HTML से EPUB फ़ाइलें बनाने के लिए, आपको Calibre या Sigil जैसे समर्पित EPUB निर्माण उपकरण की आवश्यकता होगी।

प्रश्न: आउटपुट में कुछ छवियां क्यों गायब हैं? उत्तर: असामान्य पथ या गैर-मानक प्रारूपों वाली छवियां सही तरीके से संसाधित नहीं हो सकती हैं। सुनिश्चित करें कि "छवियों को शामिल करें" विकल्प सक्षम है। कुछ EPUB फ़ाइलें URL के माध्यम से बाहरी छवियों का संदर्भ देती हैं जिन्हें एम्बेड नहीं किया जा सकता है।