Speaker Recognitionとは?概要やメリットを解説


Speaker Recognitionの概要

Speaker Recognitionとは、音声生物測定学を利用することによって話者を認証して識別するSpeechサービス機能です。「話しているのは誰か」といった問いに回答するのが大きな目的です。

一人の話者のデータを登録することにより、プロファイルが作成されます。次にオーディオサンプルとこのプロファイルを確認し、同一であるか(話者認証)が行われます。

さらにグループに対しても任意のプロファイルと一致するかの確認(話者識別)を行います。

検証プロセスを合理化することにより、スムーズかつ安全なカスタマーエクスペリエンスを提供します。

音声データは、エンタープライズグレードのセキュリティやコンプライアンスにより守られています。

Speaker Recognitionのメリット

Speaker Recognitionには、以下のようなメリットがあります。

  • 2種類の検証
  • 言語

2種類の検証

話者認証を行う際、テキストに依存する方法と依存しない方法があります。依存する場合は登録フェーズと検証フェーズにおいて、パスフレーズは話者が選択することになります。テキストを保存しない検証では、日常的な言語を利用することができることになります。

言語

サポートされている言語は、英語、フランス語、スペイン語、中国語、ドイツ語、イタリア語、日本語、ポルトガル語です。

参考資料

https://azure.microsoft.com/ja-jp/services/cognitive-services/speaker-recognition/

>>Microsoft Azure導入に関するご相談はこちらから