Co to jest ekstrakcja numeru telefonu?

Ekstrakcja numeru telefonu to proces automatycznego identyfikowania i izolowania numerów telefonów z nieustrukturyzowanego tekstu. Numery telefonów pojawiają się w wielu formatach na całym świecie—niektóre używają nawiasów, inne myślników lub spacji, a numery międzynarodowe zawierają kody krajów ze znakami plus. Ta różnorodność sprawia, że ręczna ekstrakcja jest żmudna i podatna na błędy, szczególnie w przypadku dużych ilości tekstu z wiadomości e-mail, dokumentów lub stron internetowych.

Nowoczesna ekstrakcja numeru telefonu opiera się na zaawansowanych algorytmach analizy, które rozumieją strukturę numerów telefonów w różnych krajach. Algorytmy te mogą rozróżniać między prawidłowymi numerami telefonów a losowymi sekwencjami cyfr, rozpoznawać reguły formatowania specyficzne dla danego kraju i walidować numery względem międzynarodowych standardów telekomunikacyjnych, takich jak E.164.

Opis narzędzia

To narzędzie ekstrahuje numery telefonów z dowolnego tekstu, który podasz, niezależnie od ich formatu. Po prostu wklej swój tekst zawierający numery telefonów, a narzędzie zidentyfikuje, przeanalizuje i wyświetli listę wszystkich znalezionych prawidłowych numerów telefonów. Możesz wybrać preferowany format wyjściowy i opcjonalnie określić kraj domyślny dla numerów bez kodów krajów.

Przykłady

Tekst wejściowy:

Skontaktuj się z naszymi biurami:
US Sales: (555) 123-4567
UK Support: +44 20 7946 0958
Emergency: 911
Email john@example.com lub zadzwoń 1-800-555-0199
Wyślij nam wiadomość na 555.867.5309, aby uzyskać więcej informacji.

Wyjście (format E.164):

(555) 123-4567
+44 20 7946 0958
1-800-555-0199
555.867.5309

Wyjście (format międzynarodowy):

+1 555 123 4567
+44 20 7946 0958
+1 800 555 0199
+1 555 867 5309

Funkcje

  • Wiele formatów wyjściowych: Wybieraj spośród formatów International, National, E.164, RFC3966 lub zachowaj oryginalny format znaleziony w tekście
  • Automatyczne wykrywanie kraju: Automatycznie identyfikuje kody krajów z numerów międzynarodowych lub ustaw kraj domyślny dla numerów lokalnych
  • Usuwanie duplikatów: Opcjonalnie filtruj zduplikowane numery telefonów, które pojawiają się wiele razy w tekście
  • Ekstrakcja w czasie rzeczywistym: Numery są ekstrahowane natychmiast podczas wpisywania lub wklejania tekstu
  • Walidacja: Zwraca tylko prawidłowe numery telefonów zgodne z międzynarodowymi standardami telekomunikacyjnymi

Wyjaśnienie formatów wyjściowych

Format Opis Przykład
International Format czytelny dla człowieka ze spacjami +1 555 123 4567
National Format lokalny bez kodu kraju (555) 123-4567
E.164 Standardowy format czytelny dla maszyn +15551234567
RFC3966 Format URI dla linków click-to-call tel:+1-555-123-4567
Original Zachowuje dokładny format z tekstu źródłowego 555.123.4567

Przypadki użycia

  • Czyszczenie danych CRM: Ekstrahuj numery telefonów z bałaganiarskich danych klientów, wątków e-mail lub zaimportowanych arkuszy kalkulacyjnych, aby utworzyć czystą, ustandaryzowaną listę kontaktów
  • Generowanie leadów: Wyciągaj numery telefonów z katalogów biznesowych, web scrapingu lub materiałów marketingowych do kampanii outreach
  • Migracja danych: Konwertuj numery telefonów do formatu E.164 podczas migracji między systemami wymagającymi ustandaryzowanych formatów numerów

Jak to działa

Narzędzie używa biblioteki libphonenumber, pierwotnie opracowanej przez Google dla systemu Android. Skanuje tekst znak po znaku, identyfikując sekwencje, które mogą być numerami telefonów na podstawie długości, wzorców cyfr i znaków formatowania. Każdy kandydat jest następnie walidowany względem kompleksowej bazy danych reguł numerów telefonów specyficznych dla danego kraju, w tym prawidłowych kodów kierunkowych, długości numerów i konwencji formatowania.

Gdy brak kodu kraju, narzędzie używa wybranego kraju domyślnego do interpretacji numeru. Na przykład „555-123-4567" byłby analizowany jako numer amerykański, jeśli wybrano Stany Zjednoczone, lub jako numer innego kraju na podstawie Twojego wyboru.

Porady

  • Ustaw kraj domyślny podczas ekstrahowania numerów lokalnych bez kodów krajów, aby poprawić dokładność
  • Używaj formatu E.164 podczas przechowywania numerów w bazach danych lub API—to międzynarodowy standard do przetwarzania maszynowego
  • Format RFC3966 jest idealny do tworzenia klikalnych linków telefonicznych w dokumentach HTML lub markdown
  • Włącz opcję „Usuń duplikaty" podczas przetwarzania tekstu, który może zawierać ten sam numer wiele razy