アノテーションは、AIの精度に影響する重要な作業です。AIモデルの開発には、大量の学習データが必要となるため、アノテーション作業には多くの人手が必要となるケースがあります。
自社の人員だけではアノテーションの人手が足りない時は、アノテーションの代行サービスを利用するのが一般的です。
しかし、アノテーション代行の費用感や、依頼先の選び方がわからない、という人も少なくないでしょう。
本記事では、アノテーションを外注する際の費用相場や費用の抑え方、外注先の選定ポイントなどについて解説していきます。
アノテーションを外注する際の費用相場
アノテーションの料金は、おもに以下の費用で構成されます。
- 業務委託費
- プロジェクト管理費
- 品質保証費
業務委託費は、アノテーション業務そのものにかかる費用のことです。そのほか、アノテーションのスケジュールや人員の管理を行うためのプロジェクト管理費、アウトプットの品質管理を行うための品質保証費がかかってきます。
プロジェクト管理費は一般的に全体の10%〜20%程度で、品質保証費はどの程度の精度を求めるかによって変動します。
費用の大半を占める業務委託費は、アノテーション対象のデータの種類や作業内容によって費用感が変わってきます。データの種類や作業内容ごとに、費用相場を説明していきます。
画像アノテーションの費用相場
画像アノテーションは、画像の分類、または画像に写っている物体や人物をマークする作業です。画像アノテーションの手法と費用相場は次の通りです。
画像分類
画像分類は、画像に写っている物体やシーンによって画像を分類するタスクです。
例えば、果物の写真であれば、りんご、バナナなど写っているもので画像を分類します。ほかにも、画像の風景を都市、山、海などに分類するケースなどもあります。
画像分類の相場は、画像1枚につき10円程度です。
矩形(バウンディングボックス)
矩形はバウンディングボックスとも呼ばれ、画像の中の特定の物体を四角形で囲んでマークするアノテーションの手法です。
道路を写した写真について、歩行者、自転車、車などをそれぞれ四角形で囲む作業がバウンディングボックスです。
バウンディングボックスの費用相場は、対象物1つに対して10円程度となります。
多角形(ポリゴン)
多角形はポリゴンとも呼ばれ、画像の中の物体を多角形で囲む作業です。矩形よりも精密な多角形で物体をマークするため、より高い精度で物体をAIに認識させることが可能となります。
ポリゴンの相場は、対象物1つあたり20円〜50円ほどですが、マークする対象物が複雑な形状をしているような場合は、多角形の頂点数に応じて費用が高くなります。
セグメンテーション
画像のセグメンテーションは、画像の中の複数の物体をそれぞれピクセル単位でマークする手法です。
セグメンテーションでは、画像内の山、道路、車、人などをそれぞれのオブジェクトを境界線で切り分け、タグ付けを行います。
セグメンテーションの単価相場は、画像1枚につき100円〜300円ほどになります。画像に写っている物体の数が多く、形状も複雑であるような場合には単価が上がります。
ランドマーク
ランドマークは、画像内の特定のオブジェクトの境界やポイントとなる部分を点でマークする作業です。
例えば、人物の写った画像であれば、目、鼻、口などの位置をマークすることで、パーツの形状や表情をAIに認識させやすくすることができます。
ランドマークの価格は、1点あたり5〜10円ほどになります。
動画アノテーションの費用相場
動画データのアノテーションは、動画の分類や、動画内に写っているものをコマ送りしながらマークする作業などがあります。
動画のアノテーション手法と費用相場について説明していきます。
動画分類
動画分類とは、動画全体を通して何が写っているのかをタグ付けする作業です。
動画分類の費用は動画の長さや作業内容によって大きく変わってきます。映っているものが少なく、短い動画であれば動画1つで20円〜が相場ですが、映っているものの数が多く、長時間の動画であれば費用は高くなります。複雑な動画では1000円以上かかることもあります。
矩形(バウンディングボックス)
矩形は、画像の矩形と同様に、対象となる物体を四角形でマークする作業です。対象物に動きがある場合には、対象物の動きに合わせてマークしていく必要があります。
動画のバウンディングボックスは、対象物1つあたり10円〜が費用相場となります。長い動画や、動きの多い動画であれば費用が上がります。
音声アノテーションの費用相場
AIは、音声データを扱うものも多々あります。音声データのアノテーションは、音声をテキストデータに変換したうえで、テキスト上の文章や単語にタグ付けをしていく方法が一般的です。
音声データのアノテーション作業について、作業内容と費用相場を説明していきます。
ケバ取り
ケバ取りは、音声データから話の内容と関係のない言葉を取るアノテーション手法です。人の音声は、「あー」や「えー」のような意味のない音声や言い間違いが含まれるため、これらの不要な箇所を除去することにより、内容を解析しやすくなります。
ケバ取りは、音声1分あたり120円ほどです。ケバの多さや音声の聞き取りやすさによって費用は変動します。
文字起こし
文字起こしとは、音声データを文字に起こしてテキストデータを作成する作業です。文字起こしをすることによって、音声認識のAIに正解のデータを与えることができます。
文字起こしは、音声1分あたり250円ほどです。音声の質や話す速度などによって費用は変動します。
整文
整文は、音声データを、理解しやすい文章に直しながらテキストデータを作成する作業です。話し言葉のくせなどを整えて、文章として理解しやすい形にすることが整文の目的です。
整文は、音声1分あたり350円ほどです。文章が複雑だったり、専門性の高い内容だったりする場合、単価が高くなります。
テキストアノテーションの費用相場
テキストアノテーションは、テキスト全体、またはテキスト内の単語についてタグ付けを行う作業です。
具体的には、テキスト全体を通してポジティブな内容か、ネガティブな内容かという情報をタグ付けしたり、文章内に出現する単語について人名、国名、スポーツ名などのタグ付けを行う作業となります。
テキストアノテーションの費用相場は、作業内容によって大きく変動します。テキスト全体のアノテーションは1文あたり10円〜ほど、文章内の単語にタグ付けする作業は、1文あたり30円〜ほどになります。
アノテーション費用を抑えるには
アノテーションは、データ量や作業内容によっては多額の費用がかかってしまうものです。ここでは、少しでも費用を安く抑えるための方法を紹介していきます。
必要最低限で依頼する
アノテーションは、ひとつひとつの作業に対して費用が発生します。そのため、AIの学習に必要なデータ項目をあらかじめよく検討し、本当に必要な作業のみに絞って依頼をすることで、費用を抑えることができます。
また、アノテーションの作業を効率的に行ってもらうために、ラベル付けの判断基準などを明確に記したマニュアルを整備しておくことも有効な方法です。
オフショア
アノテーションの費用のほとんどは人件費が占めます。そのため、人件費の安い国に外注すると、アノテーションの費用の削減が見込めます。
ただし、外国人に作業を依頼することになるため、日本語のテキストデータなどのアノテーション作業は対応してもらえない可能性があります。
また、依頼内容が正確に伝わらず、要件通りの作業をしてもらえないリスクもあるため、コミュニケーションに問題はないかなどを確認した上で依頼するとよいでしょう。
クラウドソーシングを活用する
クラウドソーシングを活用して、アノテーションの費用を安く抑えるという方法もあります。
しかし、クラウドソーシングは企業よりも費用相場が安い一方で、作業者のスキルを把握することが難しいという問題があります。品質の低いアウトプットが納品された場合、修正のために自社の対応コストがかかってしまい、かえってトータルの費用がかさんでしまう、ということになりかねません。
そのため、クラウドソーシングを活用する際には、作業者のスキルレベルを見極めてから依頼をするようにしましょう。
アノテーションの外注先を選定する際のポイント
アノテーションの外注で失敗しないために、アノテーションを依頼する際の注意点やポイントについて解説していきます。
精度と品質の高さ
アノテーションの精度と品質は、AIモデルの精度を大きく左右するため、外注先選定において重要なポイントとなります。
精度や品質を測る指標として、アノテーションツールの種類、アノテーションを行う作業者のスキルレベル、品質管理体制などを確認するとよいでしょう。
実績の豊富さ
アノテーションの実績も外注先選定において重要です。類似案件の実績が豊富であれば、外注先のノウハウに基づいたスムーズなプロジェクト進行が期待できます。
外注先のこれまで担当してきた業界や、アノテーションの作業内容などをもとに、自社の依頼したい案件を任せられそうであるかを確認しましょう。
柔軟な対応が可能か
自社の要件やニーズに従って柔軟に対応してもらえる外注先であるかも、確認すべきポイントのひとつです。
コミュニケーション体制が整っており、要望に対してきちんとした対応をしてくれる依頼先であれば、追加依頼や変更が発生した際も相談がしやすいでしょう。
まとめ
本記事で解説してきたように、アノテーションを外注する際には、各社の実績や費用を確認した上で依頼先を決めていく必要があります。
複数の事業者にアポイントを取り、料金やサービス内容を比較検討していると、アノテーションの依頼までにどうしても時間がかかってしまうものです。
エッジワークなら、アノテーションのご要件に応じて、最適なプロ人材をご提案することが可能です。
エッジワークでは、フリーランス人材や副業人材など、アノテーションの経験が豊富なプロが多数在籍しており、スピーディに仕事を依頼することができます。
費用やサービスの内容について、ぜひお気軽にお問い合わせください。
副業社員・フリーランスなどのスポットワーカーにプロジェクト単位でタスクを依頼・発注できるプロ人材活用サービス