Web教材一覧システムの活用情報検索系システム

データサイエンス、データガバナンス


データサイエンス、データガバナンスとは

大量かつ複雑化したデータ、つまりビッグデータを分析・活用することで、企業は業種や規模にかかわらず、これまでとは別の角度からビジネス課題を見つけることが可能になりました。そして、新しいビジネスアイディアを見つけることで企業の成長に繋げたり、ビジネスに変化をもたらすといった点で、データの収集・整理・分析・活用などに関して経営的観点からマネジメントすることが重要です。それをデータガバナンスといいます。
 また、高度な加工、正しい分析には、統計学や情報技術の活用が不可欠です。そのような学術分野をデータサイエンスといい、データから有意義な洞察を引き出す研究分野の包括的な概念です。

これらの概念は新しいものではありません。用語として普及したかどうかは別として、データを分析して有益な情報を発見しよう、最適な手段を求めようとする努力は、昔から行われてきました。その積み重ねでデータサイエンスの対象や重要性も変化してきたのです。それとともに、データガバナンスの重要性も認識されてきました。

データサイエンスの発展

大量データの体系

分類の切り口が多様ですので、体系化は困難ですが、近年よく用いられる用語を掲げました。

  データスワンプ 目的も不明確なまま集めた、構造化データ、非構造化データ
  │
  │←─┬ データカタログ
  │  └ データクレンジング
  ↓
  データレイク すべての構造化データと非構造化データを保存できる一元化されたデータの集合
   │
   ├ 構造化データ
   │  ├ 社内基幹系システム
   │  │  └ データベース
   │  ├ 社内情報系システム
   │  │  ├ データウェアハウス
   │  │  └ データマート
   │  └ データ共有
   │     ├ オープンデータ
   │     └ データプール
   │
   ├ 非構造化データ
   │  └ 非構造データベース
   │      └ テキストマイニング
   │
   └ 構造化・非構造化データ
      ├ データマイニング
      └ AI・機械学習

これらの多くは既出ですので、それ以外の用語を簡単に説明します。

データサイエンティスト

データサイエンス分野に従事する大学や研究所での研究者やビジネス界で実務応用を行う技術者などです。ビジネス界では次のような活用分野で多様な職種があります。

これらの分野は互いに重複していますし、掲げた職種も他分野の能力が必要です。データサイエンティストとして、特に重要な知識・スキルには次の3点が求められます。

このような知識・スキルを持つ人材が必要なことは、多くの企業や組織が認めているのですが、深刻な人材不足に悩んでいます。
 その対策として、官民で様々な取組が行われています。国もデータサイエンティストの育成は急務としており、統計局ホームページに統計力向上サイト「データサイエンス・スクール」を開設しています。大学等でもデータサイエンスの講座が設けられているほか、自社内のデータサイエンティストの育成に力を入れる企業やトレーニングコースを設けて外部から受講者を募集する取組みもあります。