【Amazon Rekognition】カスタムラベルとカスタムモデレーションの違い

はじめに

Amazon Rekognitionにはカスタムラベルとカスタムモデレーションという機能が存在します。
どちらも「AWSの用意したカテゴリに当てはまらない画像へカテゴリを与える」という機能ですが、あまりよく知らない状態では「どちらも同じでは…?結局どういうときにどっちを使えばよいの?」となってしまう方もいらっしゃると思いますので、違いを簡単にまとめたいと思います。

カスタムラベルについて

こちらはユーザー任意の画像にたいし、新たなラベルを付与することができる機能です。
https://aws.amazon.com/jp/rekognition/custom-labels-features/

たとえば「犬」の画像をさらに「トイプードル」や「ミニチュアシュナウザー」など種類ごとに識別できるようにしたい場合は、こちらの機能を使用して新たに「トイプードル」などのラベルを追加し、画像に付与することで、カテゴライズを行うことができます。

料金は以下の通りです。
公式ページより引用させていただきました。

特徴 料金
推論 USD 4.00/時間
トレーニング USD 1.37/時間

カスタムモデレーションについて

こちらはカスタムラベルとは異なり、自分自身でラベルを作成することはできず、あらかじめ AWS が用意したラベルに当てはまるようトレーニングを行うことができる機能です。

たとえば「ガラスの破片」の画像に「凶器」というラベルを付与することはできますが、新たに「ガラスの破片」というラベルを作成することはできません。

モデレーションで使用できるラベルのリストは下記で確認が行えます。
https://docs.aws.amazon.com/ja_jp/rekognition/latest/dg/moderation.html

料金は以下の通りです。
公式ページより引用させていただきました。

特徴 (画像数/月) 料金
トレーニング - 1 時間あたりUSD 5
推論 最初の 1,000,000 画像 USD 0.00156
次の 4,000,000 画像 USD 0.0012
次の 30,000,000 画像 USD 0.00096
35,000,000 枚以上の画像 USD 0.000375

どちらを使えば良いか迷ったときは

使用用途に限って言えば、以下のような判断基準で大丈夫かと思われます。

識別したいもの カスタムラベル カスタムモデレーション
自社製品のカテゴライズ等、細分化して表示したいコンテンツ ×
明らかに違法なものや精神的に有害なコンテンツ
一般的には問題ないが、自社サイトでは表示したくないコンテンツ ×

「どちらを使ってもよさそうだな…」というケースの場合は、識別する画像枚数や推論時間に応じ、料金表と相談して決めるのが良いかもしれません。(予算があまりない場合はカスタムモデレーションがおすすめです。)

余談

Amazon Rekognition のコンソール画面を見ると、上記で取り上げた二つの機能に挟まれて「一括分析」という項目があります。

こちらも画像にラベルを付与することができる機能で、例えば S3 などのストレージに保存した大量の画像をまとめて分析することが可能です。

おわりに

膨大な量の画像を前に、人間の手と目で一枚一枚「この画像には何が写っていて、どういう種類なのか?」を分析をしていくのは、とても時間がかかりますし、あまり現実的ではありません。
そういった作業を肩代わりしてもらえるという点で、この「カスタムラベル」と「カスタムモデレーション」は、とても革新的な機能だと思います。(その分コストが…ですが)
画像分析にお困りの際は、必要に応じてぜひ導入をご検討ください。

投稿者プロフィール

omi
AWS の諸々について、初学者目線から書いていけたらいいなと思っています!