問題
問27
蓄積された販売データなどから、天候と売れ筋商品の関連性などの規則性を見つけ出す手法を表す用語はどれか。
- データウェアハウス
- データプロセッシング
- データマイニング
- データモデリング
[出典:ITパスポート試験 平成28年度秋期 問27]
正解
正解は「ウ」です。
解説
正解は「データマイニング」です。データマイニングとは、大量に蓄積されたデータの中から、今まで知られていなかった法則やパターン、傾向などを統計学や人工知能(AI)などの手法を使って見つけ出すことです。問題文では、販売データから天候と売れ筋商品の関連性などの「規則性を見つけ出す」とありますので、まさにデータマイニングの目的と一致します。
例えば、あるスーパーで「雨の日には、普段あまり売れない傘やレトルト食品の売上が伸びる」といった傾向を見つけたり、「おむつを買う客はビールも一緒に買うことが多い」という意外な関連性を発見し、商品の陳列やプロモーションに活用する、といったケースがデータマイニングの良い例です。
ア(データウェアハウス):
データウェアハウスは、分析を行うためのデータを保管する場所(データベース)であり、規則性を見つけ出す「手法」そのものではありません。
イ(データプロセッシング):
データプロセッシングは、データを収集・加工・分析など一連の処理を行う一般的なプロセスを指し、特定の規則性を見つけ出す手法に限定されるものではありません。
エ(データモデリング):
データモデリングは、データベースの構造を設計する手法であり、データの規則性を分析する手法ではありません。
難易度
この問題の難易度は、比較的易しいと言えます。データ分析に関する基本的なIT用語の知識が問われています。特に、データマイニングはITパスポート試験でも頻繁に出題される重要なキーワードの一つです。各用語の意味を正確に理解していれば、迷うことなく正解にたどり着けるでしょう。初心者の方でも、それぞれの用語が何を目的としているのかをイメージしながら学習すれば、十分に理解できる問題です。
用語補足
データマイニング:
大量のデータの中から、これまで知られていなかったパターンや規則性、関連性などを統計学や人工知能などの手法を用いて見つけ出す技術のことです。例えば、スーパーの購買データから「この商品を買う人は、別のこの商品も買う傾向がある」といった法則を発見するイメージです。
データウェアハウス:
企業が持つ様々なシステムから集めたデータを、分析しやすいように整理・統合して蓄積する大規模なデータベースのことです。日常の業務で使うデータとは異なり、過去のデータを長期的に保存し、分析のために特化された構造を持っています。例えるなら、宝の地図(分析データ)を探すための宝箱(データベース)のようなものです。
データプロセッシング:
収集したデータを整理、加工、分析など、一連の処理を行うことです。生データから必要な情報を取り出し、利用しやすい形に変換する作業全般を指します。例えば、アンケート用紙の回答(生データ)を集計し、グラフにする(処理)ようなイメージです。
データモデリング:
データベースに格納するデータの構造や、データ同士の関係性を図や記号を使って設計することです。どのデータをどのように保存し、関連付けるかを明確にするための設計図を作る作業です。建物を建てる際の設計図のようなものだと思ってください。
対策
この問題を解くためのポイントは、データ分析に関する主要な用語の定義を正確に把握しておくことです。特に「データマイニング」は、大量のデータから価値のある情報を発見するという具体的な目的と手法を結びつけて覚えることが重要になります。データウェアハウスがデータの「保管場所」、データプロセッシングがデータの「処理全般」、データモデリングが「データベースの設計」であるのに対し、データマイニングは「規則性の発見」という明確な役割を持つことを理解しておくと良いでしょう。それぞれの用語がどのようなシーンで活用されるかをイメージしながら学習を進めることが対策となります。

