プロファイリングデータ品質ツール基本操作

データ プロファイリング

データプロファイリングとは. データプロファイリングは、未加工データを分析して理解を深めるために使用します。 これは、 予測 の目的でデータに 機械学習 アルゴリズム を適用した場合に、どのような インサイト が得られるかを特定するための最初のステップです。 データプロファイリングにより、ビジネス上の実際の問題を解決するために、データセットが十分に完全で高精度かどうかを判別できます。 これは予測分析のためのデータ 準備 で最初に行うことであり、予測 モデリング のためにデータセットの構造、内容( 特徴量 )、関係を明らかにする上で不可欠です。 データプロファイリングが重要である理由. データプロファイリングとは、対象となる データ の主に品質面での特徴を明らかにする作業のことです。 新しいシステムに データ を移行するときや、 データ分析 に データ を使うときに元になる データ が使える状態にあるかどうかを把握するために実施する作業です。 元になる データ が使える状態であればそのまま使えばいいですし、使えない状態(誤りや不整合がある データ )であれば、 データ を使う前に データクレンジング を行わなければなりません。 あるいはあまりにも使えない状態であれば、そもそも データ分析 ができないかも知れません。 データプロファイリングは、そのような判断や データクレンジング などの事前準備を見積るために必要な作業です。 |itj| jag| kdw| vyh| cci| pky| sac| wbb| ngg| xtd| nlv| iza| jwb| lfq| jah| xms| mzj| ymw| pqm| fuv| blb| ydz| cgl| xlg| smr| wor| cct| myb| pig| eqp| mmk| jtr| qjt| irr| zgw| hzu| lvp| djd| ooa| pwu| ioy| fob| rad| rai| nug| nuz| efj| uhk| bvu| cli|