電話番号抽出とは

電話番号抽出は、非構造化テキストから電話番号を自動的に識別して抽出するプロセスです。電話番号は世界中でさまざまな形式で表示されます。括弧を使用するもの、ダッシュやスペースを使用するもの、国際番号にはプラス記号付きの国番号が含まれます。この多様性により、特にメール、ドキュメント、またはWebページから大量のテキストを処理する場合、手動抽出は面倒でエラーが発生しやすくなります。

最新の電話番号抽出は、異なる国の電話番号の構造を理解する高度なパースアルゴリズムに依存しています。これらのアルゴリズムは、有効な電話番号とランダムな数字列を区別し、国固有のフォーマットルールを認識し、E.164などの国際通信標準に対して番号を検証できます。

ツール説明

このツールは、提供されたテキストからフォーマットに関係なく電話番号を抽出します。電話番号を含むテキストを貼り付けるだけで、ツールは見つかったすべての有効な電話番号を識別、解析、リスト化します。希望する出力形式を選択でき、オプションで国番号のない番号のデフォルト国を指定できます。

入力テキスト:

Contact our offices:
US Sales: (555) 123-4567
UK Support: +44 20 7946 0958
Emergency: 911
Email john@example.com or call 1-800-555-0199
Text us at 555.867.5309 for more info.

出力 (E.164形式):

(555) 123-4567
+44 20 7946 0958
1-800-555-0199
555.867.5309

出力 (国際形式):

+1 555 123 4567
+44 20 7946 0958
+1 800 555 0199
+1 555 867 5309

機能

  • 複数の出力形式: 国際形式、国内形式、E.164、RFC3966、またはテキストで見つかった元の形式から選択可能
  • 国の自動検出: 国際番号から国番号を自動的に識別するか、ローカル番号のデフォルト国を設定
  • 重複削除: テキストに複数回表示される重複した電話番号をオプションでフィルタリング
  • リアルタイム抽出: テキストを入力または貼り付けると、番号が即座に抽出されます
  • 検証: 国際通信標準に一致する有効な電話番号のみを返します

出力形式の説明

形式 説明
国際形式 スペース付きの人間が読める形式 +1 555 123 4567
国内形式 国番号なしのローカル形式 (555) 123-4567
E.164 標準的な機械可読形式 +15551234567
RFC3966 クリック発信リンク用のURI形式 tel:+1-555-123-4567
元の形式 ソーステキストから正確な形式を保持 555.123.4567

ユースケース

  • CRMデータのクリーンアップ: 乱雑な顧客データ、メールスレッド、またはインポートされたスプレッドシートから電話番号を抽出して、クリーンで標準化された連絡先リストを作成
  • リード生成: ビジネスディレクトリ、Webスクレイピング、またはマーケティング資料から電話番号を抽出して、アウトリーチキャンペーンに使用
  • データ移行: 標準化された番号形式を必要とするシステム間で移行する際に、電話番号をE.164形式に変換

仕組み

このツールはGoogleがAndroid用に開発したlibphonenumberライブラリを使用しています。テキストを文字ごとにスキャンし、長さ、数字パターン、フォーマット文字に基づいて電話番号である可能性のあるシーケンスを識別します。その後、各候補は、有効な市外局番、番号の長さ、フォーマット規則を含む、国固有の電話番号ルールの包括的なデータベースに対して検証されます。

国番号が存在しない場合、ツールは選択したデフォルト国を使用して番号を解析します。たとえば、「555-123-4567」は、アメリカ合衆国が選択されている場合はUS番号として解析されるか、選択に基づいて別の国の番号として解析されます。

ヒント

  • 国番号のないローカル番号を抽出する場合は、デフォルト国を設定して精度を向上させます
  • データベースまたはAPIに番号を保存する場合はE.164形式を使用してください。これは機械処理の国際標準です
  • RFC3966形式は、HTMLまたはmarkdownドキュメント内でクリック可能な電話リンクを作成するのに最適です
  • 同じ番号が複数回含まれる可能性があるテキストを処理する場合は、「重複を削除」を有効にします