ある動画配信サービスが、ユーザーがアップロードした動画ファイル(MP4形式)と、その動画に対するコメントテキスト、サムネイル画像をクラウドに保存している。これらのデータを適切に分類するとき、「動画ファイル」と「コメントテキスト」はそれぞれどのデータ種別に該当するか。
- A. 動画ファイル:構造化データ/コメントテキスト:半構造化データ
- B. 動画ファイル:非構造化データ/コメントテキスト:構造化データ
- C. 動画ファイル:非構造化データ/コメントテキスト:非構造化データ
- D. 動画ファイル:半構造化データ/コメントテキスト:構造化データ
解答と解説を見る
正解: C
MP4形式の動画ファイルは固定スキーマを持たないバイナリデータであり「非構造化データ」に分類される。コメントテキストも自由記述の文字列であり、固定スキーマが定義されているわけではないため「非構造化データ」に該当する。したがって正解は両者とも非構造化データであるCとなる。選択肢Aの「動画ファイルが構造化データ」という分類は誤りで、構造化データはリレーショナルテーブルのように行・列・データ型が定義されたデータを指す。選択肢Bは動画ファイルの分類は正しいが、コメントテキストを構造化データとするのは誤り(もしコメントIDや投稿日時など固定フィールドをもつレコード全体であれば構造化だが、テキスト内容単体は非構造化)。選択肢Dは両方の分類が不正確である。