AWS によるデータガバナンス
データへのアクセスとコントロールのバランスを取り、データドリブンの意思決定を促進
概要
AWS によるデータガバナンスの利点
-
データベース、データレイク、データウェアハウスなど、最も価値のあるデータソースを特定して管理することで、重要なデータアセットのコピーや冗長な変換を制限できます。データをキュレーションするということは、適切なデータが正確かつ最新で、機密情報が特定されていることを確認し、ユーザーがデータドリブンの意思決定やデータフィードアプリケーションに自信を持てるようになることも意味します。
-
データの意味を発見して理解することで、データ利用者が自信を持ってデータを使用してビジネス価値を高めることができます。一元化されたデータカタログを使用すると、データの容易な検索、アクセスの要求、およびビジネス上の意思決定を行うためのデータの使用が可能になります。
-
データのプライバシー、セキュリティ、アクセスのバランスを取ります。ビジネスユーザーとエンジニアリングユーザーの両方にとって直感的なツールを使用して、組織の境界を越えてデータアクセスを管理します。
-
データが誰によってどのように使用されているかを把握できます。AWS のサービスは、機械学習モデルによるアクセスを始めとするデータアクセスをモニタリングおよび監査して、データセキュリティと規制コンプライアンスを確保するのに役立ちます。また、機械学習には、責任ある使用とレポート作成の簡素化を実現するための監査の透明性も必要です。
AWS でデータガバナンスの課題に取り組む
サイロ化された基幹業務 (LOB)、複数のフォーマット (オープンまたは独自) で保存されたデータ、および複数のストレージデバイスに保存されているデータが原因で、企業において把握されている利用可能なデータの全体像は限られています。このような盲点があると、管理されていないデータがガバナンスのリスクにさらされます。
データガバナンスが不十分だと、データアクセスを容易にするためにデータコピーが作成されるなど、別の種類のデータスプロールが発生する可能性があります。データが頻繁にコピーされると、ビジネスの信頼できる情報源としての信頼性が低下します。データのコピーがあらゆる場所に存在し、場合によっては少し変更されることもあります。その結果、複数の LOB にわたってデータレイクの接続やガバナンスが損なわれる可能性があります。
企業全体のデータを調整して整理したとしても、データを説明するセマンティック情報はほとんどないため、そのデータの意味を理解するのは容易ではありません。
組織全体でデータユーザーの数が増えるにつれて、ターゲットを絞ったビジネスイニシアティブの意思決定に役立つ最適なデータアセットを見つけて共有することが難しくなります。
企業がより多くのユーザーにわたってより多くのデータを管理するにつれて、組織内外の適切なユーザーが適切なデータにアクセスできるようにすると、スケーリングと維持がますます困難になります。
アクセスの制限が過剰であれば、ビジネス上の意思決定が遅くなる可能性があります。アクセスが甘すぎると、リスクが生じる可能性があります。
-
企業の規制やコンプライアンス義務の範囲が拡大するにつれて、誰がデータにアクセスしているのか、また、そのアクセスがポリシーやコンプライアンス規制と一致しているかどうかを把握するのが難しくなることがよくあります。
データガバナンスに関する AWS Master Class
データガバナンスはどのようにしてビジネスイニシアティブを加速させることができるのでしょうか? 既存のエンタープライズ機能を活用して、データガバナンスのロードマップを構築し、安全な資金調達を実現するにはどうすればよいですか? このデータガバナンスの Master Class では、Kevin Lewis がよくある失敗例と、実証済みのベストプラクティスをご紹介します。