ある企業のデータエンジニアが、Azure Data Factory のデータフロー機能(Mapping Data Flow)を使って、受注データから不正な行(受注金額が負値・顧客IDが null)を除去する変換処理を設計している。この要件に直接対応するデータフロー変換の種類はどれか。
- A. Aggregate(集計)変換:グループ化と集計関数を適用する
- B. Join(結合)変換:2つのデータストリームを指定条件で結合する
- C. Filter(フィルター)変換:指定した条件を満たす行のみを通過させる
- D. Pivot(ピボット)変換:行データを列データに転換する
解答と解説を見る
正解: C
Filter 変換は指定した条件式(ブール式)を評価し、条件が true の行のみを後続に通過させる変換である。「受注金額 > 0 AND 顧客ID != null」のような条件式を設定することで不正行を除去できる。ADF の Mapping Data Flow では GUI でフィルター条件を記述できるため、コードなしで実装可能である。選択肢 A の Aggregate 変換はグループ化と sum・count・avg などの集計関数を適用する変換であり、行の除去には使わない。選択肢 B の Join 変換は2つのデータストリームをキーで結合するものであり、単一ストリーム内の行除去とは異なる。選択肢 D の Pivot 変換は行を列に転換する再形成処理であり、不正行の除去には使用しない。