Что такое извлечение номеров телефонов?

Извлечение номеров телефонов — это процесс автоматического определения и выделения номеров телефонов из неструктурированного текста. Номера телефонов встречаются во многих форматах по всему миру — некоторые используют скобки, другие используют дефисы или пробелы, а международные номера включают коды стран со знаком плюса. Это разнообразие делает ручное извлечение утомительным и подверженным ошибкам, особенно при работе с большими объемами текста из писем, документов или веб-страниц.

Современное извлечение номеров телефонов основано на сложных алгоритмах анализа, которые понимают структуру номеров телефонов в разных странах. Эти алгоритмы могут различать действительные номера телефонов и случайные последовательности цифр, распознавать правила форматирования, специфичные для каждой страны, и проверять номера в соответствии с международными стандартами телекоммуникаций, такими как E.164.

Описание инструмента

Этот инструмент извлекает номера телефонов из любого предоставленного вами текста, независимо от того, как они отформатированы. Просто вставьте текст, содержащий номера телефонов, и инструмент определит, проанализирует и выведет список всех найденных действительных номеров телефонов. Вы можете выбрать предпочитаемый формат вывода и при необходимости указать страну по умолчанию для номеров без кодов стран.

Примеры

Входной текст:

Свяжитесь с нашими офисами:
US Sales: (555) 123-4567
UK Support: +44 20 7946 0958
Emergency: 911
Email john@example.com или позвоните 1-800-555-0199
Напишите нам на 555.867.5309 для получения дополнительной информации.

Вывод (формат E.164):

(555) 123-4567
+44 20 7946 0958
1-800-555-0199
555.867.5309

Вывод (Международный формат):

+1 555 123 4567
+44 20 7946 0958
+1 800 555 0199
+1 555 867 5309

Возможности

  • Несколько форматов вывода: Выбирайте из Международного, Национального, E.164, RFC3966 или сохраняйте исходный формат, найденный в тексте
  • Автоматическое определение страны: Автоматически определяет коды стран из международных номеров или устанавливает страну по умолчанию для локальных номеров
  • Удаление дубликатов: При необходимости отфильтруйте дублирующиеся номера телефонов, которые несколько раз появляются в вашем тексте
  • Извлечение в реальном времени: Номера извлекаются мгновенно при вводе или вставке текста
  • Проверка: Возвращает только действительные номера телефонов, соответствующие международным стандартам телекоммуникаций

Объяснение форматов вывода

Формат Описание Пример
Международный Удобный для чтения формат с пробелами +1 555 123 4567
Национальный Локальный формат без кода страны (555) 123-4567
E.164 Стандартный машиночитаемый формат +15551234567
RFC3966 URI формат для ссылок click-to-call tel:+1-555-123-4567
Исходный Сохраняет точный формат из исходного текста 555.123.4567

Варианты использования

  • Очистка данных CRM: Извлекайте номера телефонов из беспорядочных данных клиентов, цепочек писем или импортированных электронных таблиц для создания чистого, стандартизированного списка контактов
  • Генерация лидов: Извлекайте номера телефонов из деловых справочников, веб-скрейпинга или маркетинговых материалов для кампаний по привлечению клиентов
  • Миграция данных: Преобразуйте номера телефонов в формат E.164 при миграции между системами, требующими стандартизированных форматов номеров

Как это работает

Инструмент использует библиотеку libphonenumber, первоначально разработанную Google для Android. Он сканирует ваш текст посимвольно, определяя последовательности, которые могут быть номерами телефонов на основе длины, шаблонов цифр и символов форматирования. Затем каждый кандидат проверяется в соответствии с комплексной базой данных правил номеров телефонов, специфичных для каждой страны, включая действительные коды областей, длины номеров и соглашения по форматированию.

Когда код страны отсутствует, инструмент использует выбранную вами страну по умолчанию для интерпретации номера. Например, "555-123-4567" будет проанализирован как номер США, если выбраны Соединенные Штаты, или как номер другой страны в зависимости от вашего выбора.

Советы

  • Установите страну по умолчанию при извлечении локальных номеров без кодов стран для повышения точности
  • Используйте формат E.164 при сохранении номеров в базах данных или API — это международный стандарт для машинной обработки
  • Формат RFC3966 идеален для создания кликабельных ссылок на телефоны в HTML или markdown документах
  • Включите "Удалить дубликаты" при обработке текста, который может содержать один и тот же номер несколько раз