問題
問16
教師あり学習において,正解となる情報を付与する作業を表す用語として,最も適切なものはどれか。
- アノテーション
- エンコード
- データクレンジング
- フィルタリング
[出典:ITパスポート試験 令和8年度 問16]
正解
正解は「ア」です。
解説
正解は「アノテーション」です。アノテーションとは、テキストや画像、音声といったあらゆる形態のデータに対して、そのデータの内容や意味を説明する注釈(タグやラベル)を付ける作業のことです。AIの「教師あり学習」では、コンピューターが学習するために「正解」となるデータが必要になります。
例えば、AIに「猫」を正しく認識させたい場合、大量の動物の写真を用意し、一枚ずつ「これは猫です」という正解ラベルを貼り付ける作業がアノテーションにあたります。この作業によって作成された正解付きデータ(学習データ)を読み込ませることで、AIは初めて猫の特徴を理解できるようになります。
日常的な例で言えば、小さなお子様に絵本を見せながら「これはリンゴだよ」「これはバナナだよ」と名前を教える行為に非常に似ています。AIという生徒に対して、人間が正解を提示して導いてあげる、機械学習の土台を支える非常に重要なプロセスです。
イ(エンコード):
データを特定の規則に従って、別の形式やコードに変換する処理のことですので、正解を付与する作業とは異なります。
ウ(データクレンジング):
データの誤りや重複、不足などを修正・削除してデータを綺麗に整える作業のことです。データの質を高めるために行われます。
エ(フィルタリング):
特定の条件に基づいて、必要なデータだけを抽出したり、不要なデータを除外したりする機能のことです。
難易度
この問題は、AI・機械学習の分野における極めて基礎的な用語を問うものです。IT未経験の方でも、「教師あり学習」という言葉の意味(正解を与えて学習させること)が理解できていれば、比較的容易に正解を導き出せます。「アノテーション」という言葉は日常生活では馴染みが薄いかもしれませんが、AI関連のニュースや入門書では頻出の用語ですので、初心者にとっても得点源にしやすい問題と言えます。
用語補足
教師あり学習:
コンピューターに「正解」付きのデータを与えて、データのパターンや特徴を学習させる手法です。
ラベル(タグ):
アノテーション作業によってデータに付与される情報のことで、AIにとっての「答え」にあたります。
学習データ:
AIが学習するために使われるデータのことで、教師あり学習ではアノテーション済みのデータを使用します。
機械学習:
コンピューターが大量のデータを読み込み、自ら反復的に学習して法則性を見つけ出す技術の総称です。
対策
「教師あり学習」と「アノテーション」をセットで覚えることが最も重要です。問題文に「正解となる情報を付与する」というキーワードが出てきたら、すぐにアノテーションを連想できるようにしましょう。また、AI開発の流れ(データの収集→クレンジング→アノテーション→学習)をイメージしておくと、他の選択肢との混同を防ぎやすくなります。

