MDDBとその周辺用語
航空機のコックビットのように、必要な情報をパソコン画面に表示し、簡単な操作で多様な情報が得られる仕組み、あるいはそれを実現して提供する技術をBI(Business Intelligence)という。
BIの機能のうち、基幹系システムで収集した数値的データを整理して蓄積しておき、エンドユーザが任意の切り口で検索加工、分析する利用形態をOLAP(Online Analytical Processing)といい、その実装をデータウェアハウス(DWH:Data WareHouse)という。
データウェアハウスでのデータベースには、多次元データベース(MDDB:Multi-Dimensional Database)が適している。
参照:
「多次元データベース」、
「データウェアハウスの定義」、
「OLAPと多次元データベース」
ここではMDDBを取り扱うが、DWHと切り離すことはできないので、混同して取り扱うことにする。
MMDBには、当初からMMDBとして構築したMOLAPと、実体はRDBなのだがインデクスの付け方などを工夫してMMDBのように取り扱えるようにしたROLAPがある。ここでは、MOLAPを対象にするが、DWHでは双方を対象にしていることが多く、特に限定しないことにする。
主要年表
1975年? Express(最初のMDDB)
1979年 Teradata設立
1983年 Teradata、DBC/1012(Teradata最初の並列コンピュータ)
1986年 Red Brick設立
1992年 インモン、DWHの定義
1993年 コッド、OLAPの提唱
1997年 Microsoft、MDX(MDDBへの問い合わせ言語)
1997年 InterSystems、Caché
1997年 Informix、MetaCube ROLAP Option
1998年 Essbase(代表的MDDB)
1998年 Informix、Red Brick買収
1999年 MetaCube ROLAP Option 4.1
2000年 IBM、AS/400にMDDB搭載
2001年 IBM、Informix買収
2005年 IBM、DB2 OLAP Server
2007年 Oracle、Hyperion買収
2008年 IBM、Cognos買収
2008年 Microsoft、DATAllegro買収
2009年 HP Oracle Database Machine
2009年 Microsoft、SQL Server Fast Track Data Warehouse
2010年 IBM、Netezza買収
2010年 EMC、Greenplum買収
2010年 EMC、EMC Greenplum Data Computing Appliance
1990年代前半まで:MDDB理論の確立
- 1975年? 最初のMDDB
MITのジョン・リトル(John Dutton Conant Little:OR待ち行列のリトルの式で有名)が、DSSツールとして開発したBRANDAIDやExpressがMDDBになっており、これが最初だとされているが不明確である。
Expressは1985年にIRI(information resources inc)が買い取り商品化した。なお同社は1995年にOracleに買収された。
- 1986年 Red Brick Systems設立
ラルフ・キンボール(Ralph Kimball)によって設立されたDWHの技術開発・コンサルティング会社。キンボールはMDDBの基本であるスター型スキーマを初めて採用した。単一プロセッサでの並列処理技術でも優れた功績をあげた。
Red Brickは、1998年にInformixに買収され、2001年にInformixはIBMに買収される。
- 1992年 Inmon、DWHの定義
プリズム(Prism Solutions)社のビル・インモン(William H. Inmon)は、著作「Building the Data Warehouse」においてDWHの定義をした。
- 1993年 Codd、OLAPの提唱
コッド(Edgar Frank Codd)はRDBの創始者であるが、1985年に「Codd's 12 Rules」を発表。データウェアハウスのような大量データを多様な切り口で検索加工するような処理形態をOLAP(Online Analytical Processing)と命名し、OLAPではRDBよりもMDDBのほうが適していると提唱した。
1990年代後半:商用MDDBの普及
- 1997年 MDX
MDX(Multi-Dimensional eXpressions)はMDDBへの問い合わせ言語(RDBのSQLに相当)。Microsoftによって開発され、Microsoft OLAP Services 7.0に実装された。MDXはオープンソースではないが、多くのOLAPベンダが発展させ、実務的な標準になっている。
- 1997年 Caché
インターシステムズ(InterSystems)社によるデータベース管理ソフト。当初からMDDBを前提に、スケーラビリティとSQL対応を重視した。現在でも組込みソフトウェアや小規模システムに使われている。
- 1998年 Essbase
Arbor Softwareにより製品化された。同社は1998年にHyperion Softwareに買収され、Essbaseはそこで大きく発展した。EssbaseがビジネスにおけるOLAPの重要性を広めたともいわれ、OLAP製品の続出を引き起こしたといわれている。
2007年にHyperion SoftwareはOracleに買収される。
InfomixとIBM
- 1997年 Informix、MetaCube ROLAP Option
- 1998年 Informix、Red Brick Systemsを買収
- 1999年 MetaCube ROLAP Option 4.1
Red Brick Systemsは、DWHの構築用ソフトウェアや構築コンサルタントとして著名。買収により市場獲得効果があった。
1997年にInformixはMDDBのMetaCube ROLAP Optionを開発していたが、1999年のバージョン4.1でOracleデータベースに対応するなど、適用範囲を拡大した。
- 2000年 IBM、AS/400にMDDB搭載
- 2001年 IBM、Informixを買収
- 2005年 IBM、DB2 OLAP Server
AS/400はIBMのオフィスコンピュータである。MDDBを搭載してDWHとして用いる特別なモデルを発表した。IBMのDWHへの参入が始まった。
とうとうInformixを買収した。こではMDDBだけでなく、データベース業界の雄を取り込んだことになる。
DB2はIBMのデータベースの中核となる製品である。このDB2にMDDB機能を追加し、並列機能をもつサーバを発表した。Microsoft Excelなどの表計算ソフトとシームレスな連携を実現している。
2000年代後半:DWHアプライアンスの進行
DWHアプライアンスとは、DWH機能をハードウェア込みでオールインワンにパッケージ製品、あるいはそれを実現するための提携や買収のこと。
既に2001年に、IBMのInfomix買収という大事件があったが、2000年代後半には続出するようになった。
- 2007年 Oracle、Hyperionを買収
- 2009年 HP Oracle Database Machine
ハイペリオン(Hyperion)社はMDDB「Essbase」の開発元。Oracle BI製品との連携を強化して2009年にOracle Essbaseとした。
さらにヒューレット・パッカードと協業して、アプライアンス製品HP Oracle Database Machineを発売、データウエアハウスに本格的に乗り出した。
- 2008年 Microsoft、DATAllegroを買収
- 2009年 Microsoft、SQL Server Fast Track Data Warehouse
データアレグロ(DATAllegro)は、大規模DWHを対象としたDWHアプライアンスの専門企業。MicrosoftはMicrosoftDATAllegroの技術をベースにした「SQL Server Fast Track Data Warehouse」を発表。これは、同社初のDWHアプライアンス製品である。
- 2008年 IBM、Cognosを買収
- 2010年 IBM、Netezzaを買収
コグノス(Cognos)は、BI関連のソフトウェア製品メーカー。IBMはDB2とCognosを同社のサーバに搭載して、IBM Smart Analytics Systemの強化につなげた。
ネティーザ(Netezza)は、Microsoftに買収されたDATAllegroのライバル企業。DWHアプライアンスに特化した独自技術と幅広い製品ラインアップをもっている。Netezza買収によりさらにIBM Smart Analytics Systemの強化、低コスト化を目指している。
- 2010年 EMC、Greenplumを買収
EMCは、ストレージ生産およびその管理システムの最大手。
グリーンプラム(Greenplum)は大規模DWH分析システムGreenplum Databaseなどの開発会社。EMCは、自社のハードウェア製品にグリーンプラムのソフトウェアを搭載したDWHアプライアンス製品EMC Greenplum Data Computing Applianceを発表した。
補足:テラデータ
DWHで重要なプレイヤーにテラデータ(Teradata)社がある。同社はMDDBやOLAPには関心がなく、独自の並列処理技術を生かした超並列コンピュータにより、超大規模データウェアハウスを実現している。
- 1983年 最初の製品DBC/1012。インテルのマイクロプロセッサを多数結合した並列コンピュータ。当時としては画期的なデータベースマシンだった。
- 1992年 1テラバイトを超える最初のシステムがWal-Martで稼働
- 1999年 世界最大規模の実稼働データベースを構築(176ノード 130テラバイト)
- 2000年 全社データを一つのコンピュータに統合するエンタープライズDHWを提唱
- 2001年 1テラバイト以上の納入実績が300客先に
- 2008年 1ペタバイト以上の納入実績が5客先に
- 2009年 Teradata Extream Data Warehouse Appliance 1555。50ペタバイトのデータ量を処理
テラデータの経緯は複雑だ。
・1979年 Teradata設立
・1991年 AT&Tに買収されたNCRがさらにTeradataを買収
・1997年 NCRがAT&Tから独立
・2007年 NCRの戦略的分社化によりTeradataになる
参考URL