DXの見える化
はじめに
DX(デジタルトランスフォーメーション)とはデータ(ビックデータ)とデジタル技術の活用により企業の競争力の優位性を高めていくことや、オンプレミスのレガシーシステムから、クラウドへの移行し必要な情報が簡単にリアルタイムで把握できるようにするというものです。
どのようなデータを見えるかするのか?
企業によって内容はさまざまですが、わかりやすいのは売上データや顧客毎の販売データでしょうか?顧客(会員)情報の獲得推移も、対象になるかもしれません。
どのようなシステム環境が必要か?
データを簡単に見えるようにするためには、BIツールなどが必要。
また、データ(ビックデータ)を蓄積するような、DWH環境も必要です。
もし、自社のシステムが複数のシステムからなる場合、これらのデータを集約することも必要になります。
クラウド環境が、AWS(Amazon Web Services)なら、BIツールはQuickSight、DWHはRedshift などの組み合わせが、
環境が、GCP(Google Cloud Platform)なら、BIツールはLooker Studio、DWHはBigQueryがメジャーどころでしょうか。
ETLとELTとデータマート
ELTとは、E:Extract:抽出、L:Load:格納、T:Transformation:変換の事で、
自社で提供している各種サービスのデータを抽出し、これをDWHに格納し、DWH上で分析しやすいように加工、変換する事です。
ETLとELTの違いは、加工、変換してから格納するか?、格納してから加工、変換するか?の違いで、ETLは格納するデータ量がが少なくなるメリットがあるが、大規模なデータの統合だとパフォーマンスが落ちる。
また、ELTは先に生データを格納するので、データの処理スピードにメリットがあるが、加工前、加工後のデータを保持するので運用コストが高くなる。
どちらもメリット、デメリットがあるので、データの量や加工の複雑さなどを検討して選択するのが重要かと思います。
・顧客情報のようなデータを扱う場合は、データの抽出と同時にマスキング処理ができるETLを選択するのがおすすめ。
・分析要件が明確になっていない場合は、生データを格納し、都度要件にあわせて変換できるELTを選択するのがおすすめ。
また、どちらもBIツール等で分析、ダッシュボードを作成する場合は、事前にデータマートなど要件にあわせた必要最小限のデータマートを作成し、BIツールから参照させる方が、セキュリティ的にも、パフォーマンス的にもよいでしょう。
おわりに
DXの見える化は、上記にあげた方法以外にも様々な方法やツールがあるので、どれが正解というのは無い気がしています。
もちろん予算やスケジュールなどで、色々試してみるというのは難しいとは思いますが、それぞれの利用用途や、データ構造、分析要件を精査し、より企業の競争力の優位性を高めるDXの構築を実施できたらと思っています。
余談ですが、データの断捨離も必要ですよね・・・