コース内容
紹介
0/5
講座タイトル
00:42
本コースの概要
02:05
講師の自己紹介
00:20
学習ロードマップ
00:16
レビューのお願い
00:31
データ品質管理ことはじめ
データ品質管理ことはじめ
0/9
データマネジメントとは?
01:03
データ品質管理とは何か?
02:47
データ品質管理の最適な比率
02:47
データ品質とデータ品質のテストとは何か?
02:03
データ品質6つの指標
03:10
意外と難しいデータ品質の担保
02:13
データの劣化パターン
02:13
メタデータとは何か?
00:32
環境構築
01:30
データ品質のテストとリペア
データ品質のテストとリペア
0/17
今回利用するデータの確認
04:57
テストレベルの設定
02:32
現状把握のための便利関数
01:27
ゼロコントロール
01:40
レンジテストと辞書テスト
02:52
if-thenテスト
05:15
Nullチェックとユニークネス
04:29
パターンチェック
01:19
コンシステンシー
05:43
レイショーコントロール
01:42
タイムラインネス
02:18
メタデータ品質のテスト
06:05
0件テスト
02:48
カラム数チェック
00:53
データのリペア
05:21
ストリーミングのテスト
02:51
これまでのテストを参考に、ご自身でデータのテストを記載しよりデータを堅牢にしていきましょう
メタデータとデータ品質の連携
非構造データのラングリング(エクストラ)
0/3
メタデータとデータ品質の連携
02:23
実際に品質の結果をmysqlに保存してみよう
08:08
プリベンション
03:13
【PythonとSparkで始めるデータマネジメント入門】 ビッグデータレイクのためのテーブルデータ品質管理入門
レッスン内容
データは放っておくだけだとどんどん劣化します。
劣化するパターンを知って対策に繋げていきましょう。
0%
完了
受講を完了する
リンクの挿入/編集
閉じる
リンク先 URL を入力してください
URL
リンク文字列
リンクを新しいタブで開く
または既存のコンテンツにリンク
検索
検索キーワードが指定されていません。最近の項目を表示しています。
検索もしくは上下矢印キーを使って項目を選択してください。
キャンセル