फोन नंबर निष्कर्षण क्या है?

फोन नंबर निष्कर्षण असंरचित पाठ से फोन नंबर को स्वचालित रूप से पहचानने और अलग करने की प्रक्रिया है। फोन नंबर दुनिया भर में कई प्रारूपों में दिखाई देते हैं—कुछ कोष्ठक का उपयोग करते हैं, अन्य डैश या स्पेस का उपयोग करते हैं, और अंतर्राष्ट्रीय नंबर प्लस चिन्ह के साथ देश कोड शामिल करते हैं। यह विविधता मैनुअल निष्कर्षण को थकाऊ और त्रुटि-प्रवण बनाती है, विशेषकर ईमेल, दस्तावेज़ या वेब पृष्ठों से बड़ी मात्रा में पाठ के साथ काम करते समय।

आधुनिक फोन नंबर निष्कर्षण परिष्कृत पार्सिंग एल्गोरिदम पर निर्भर करता है जो विभिन्न देशों में फोन नंबर की संरचना को समझते हैं। ये एल्गोरिदम वैध फोन नंबर और यादृच्छिक अंक अनुक्रमों के बीच अंतर कर सकते हैं, देश-विशिष्ट स्वरूपण नियमों को पहचान सकते हैं, और E.164 जैसे अंतर्राष्ट्रीय दूरसंचार मानकों के विरुद्ध नंबर को मान्य कर सकते हैं।

उपकरण विवरण

यह उपकरण आपके द्वारा प्रदान किए गए किसी भी पाठ से फोन नंबर निकालता है, चाहे वे कैसे भी स्वरूपित हों। बस अपना पाठ पेस्ट करें जिसमें फोन नंबर हों, और उपकरण सभी वैध फोन नंबर की पहचान, पार्स और सूची बनाएगा। आप अपना पसंदीदा आउटपुट प्रारूप चुन सकते हैं और वैकल्पिक रूप से देश कोड के बिना नंबर के लिए एक डिफ़ॉल्ट देश निर्दिष्ट कर सकते हैं।

उदाहरण

इनपुट पाठ:

हमारे कार्यालयों से संपर्क करें:
यूएस बिक्रय: (555) 123-4567
यूके समर्थन: +44 20 7946 0958
आपातकाल: 911
john@example.com को ईमेल करें या 1-800-555-0199 पर कॉल करें
अधिक जानकारी के लिए हमें 555.867.5309 पर टेक्स्ट करें।

आउटपुट (E.164 प्रारूप):

(555) 123-4567
+44 20 7946 0958
1-800-555-0199
555.867.5309

आउटपुट (अंतर्राष्ट्रीय प्रारूप):

+1 555 123 4567
+44 20 7946 0958
+1 800 555 0199
+1 555 867 5309

विशेषताएं

  • कई आउटपुट प्रारूप: अंतर्राष्ट्रीय, राष्ट्रीय, E.164, RFC3966, या पाठ में पाए गए मूल प्रारूप को संरक्षित करने में से चुनें
  • देश स्वचालित पहचान: अंतर्राष्ट्रीय नंबर से देश कोड की स्वचालित रूप से पहचान करता है, या स्थानीय नंबर के लिए एक डिफ़ॉल्ट देश सेट करता है
  • डुप्लिकेट हटाना: वैकल्पिक रूप से डुप्लिकेट फोन नंबर को फ़िल्टर करें जो आपके पाठ में कई बार दिखाई देते हैं
  • रीयल-टाइम निष्कर्षण: जैसे ही आप पाठ टाइप या पेस्ट करते हैं, नंबर तुरंत निकाले जाते हैं
  • सत्यापन: केवल वैध फोन नंबर लौटाता है जो अंतर्राष्ट्रीय दूरसंचार मानकों से मेल खाते हैं

आउटपुट प्रारूप समझाया गया

प्रारूप विवरण उदाहरण
अंतर्राष्ट्रीय स्पेस के साथ मानव-पठनीय प्रारूप +1 555 123 4567
राष्ट्रीय देश कोड के बिना स्थानीय प्रारूप (555) 123-4567
E.164 मानक मशीन-पठनीय प्रारूप +15551234567
RFC3966 क्लिक-टू-कॉल लिंक के लिए URI प्रारूप tel:+1-555-123-4567
मूल स्रोत पाठ से सटीक प्रारूप को संरक्षित करता है 555.123.4567

उपयोग के मामले

  • CRM डेटा सफाई: गंदे ग्राहक डेटा, ईमेल थ्रेड, या आयातित स्प्रेडशीट से फोन नंबर निकालें ताकि एक स्वच्छ, मानकीकृत संपर्क सूची बनाई जा सके
  • लीड जनरेशन: व्यावसायिक निर्देशिकाओं, वेब स्क्रैप, या आउटरीच अभियानों के लिए विपणन सामग्री से फोन नंबर खींचें
  • डेटा माइग्रेशन: सिस्टम के बीच माइग्रेट करते समय फोन नंबर को E.164 प्रारूप में परिवर्तित करें जिन्हें मानकीकृत नंबर प्रारूप की आवश्यकता होती है

यह कैसे काम करता है

उपकरण libphonenumber लाइब्रेरी का उपयोग करता है, जिसे मूल रूप से Google द्वारा Android के लिए विकसित किया गया था। यह आपके पाठ को वर्ण दर वर्ण स्कैन करता है, लंबाई, अंक पैटर्न और स्वरूपण वर्णों के आधार पर फोन नंबर हो सकने वाले अनुक्रमों की पहचान करता है। प्रत्येक उम्मीदवार को फिर देश-विशिष्ट फोन नंबर नियमों के एक व्यापक डेटाबेस के विरुद्ध सत्यापित किया जाता है, जिसमें वैध क्षेत्र कोड, नंबर लंबाई और स्वरूपण सम्मेलन शामिल हैं।

जब कोई देश कोड मौजूद नहीं होता है, तो उपकरण नंबर की व्याख्या करने के लिए आपके चयनित डिफ़ॉल्ट देश का उपयोग करता है। उदाहरण के लिए, "555-123-4567" को यूनाइटेड स्टेट्स चयनित होने पर यूएस नंबर के रूप में पार्स किया जाएगा, या आपके चयन के आधार पर किसी अन्य देश के नंबर के रूप में।

सुझाव

  • देश कोड के बिना स्थानीय नंबर निकालते समय सटीकता में सुधार के लिए एक डिफ़ॉल्ट देश सेट करें
  • डेटाबेस या API में नंबर संग्रहीत करते समय E.164 प्रारूप का उपयोग करें—यह मशीन प्रसंस्करण के लिए अंतर्राष्ट्रीय मानक है
  • RFC3966 प्रारूप HTML या markdown दस्तावेज़ों में क्लिक करने योग्य फोन लिंक बनाने के लिए बिल्कुल सही है
  • "डुप्लिकेट हटाएं" सक्षम करें जब पाठ को संसाधित करते समय जिसमें एक ही नंबर कई बार दिखाई दे सकता है