Webメモ


メモです。
by yurinass
S M T W T F S
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31
カテゴリ
以前の記事
フォロー中のブログ
その他のジャンル
ファン
記事ランキング
ブログジャンル
画像一覧

「分析は力なり」みずからの創意工夫で競争優位に立つ

数あるITの中でも、ビジネス・インテリジェンス(BI)は、特にユーザーのスキルが導入の成否に直結すると言われる。ここ数年、BIで大きな効果を上げた先進的な企業が着目しているのは、ユーザーみずからの「分析力」である。本パートでは、非構造化データから重要なトレンドを発見する分析/マイニング・ツールを効果的に活用することで、競合他社との差別化を図ることができた米国企業の事例を挙げながら、“分析の極意”に迫ってみたい。

Jennifer McAdams/Heather Havenstein
Computerworld米国版

パワフルな組み合わせ──BIとテキスト分析

 今、医療業界や保険、金融業界の先進ユーザー企業の多くが、ビジネス・インテリジェンス(BI)ツールが主に扱う構造化データを、非構造化テキストに結び付けることのメリットに着目している。


 テキスト分析(Text Analytics)/テキスト・マイニング・ツールは、企業内のあちこちに分散する非構造化テキストを系統立てるため、言語学、ルール・ベースの自然言語処理、特殊化したアルゴリズムなどのメソッドを用いる。最近では、種類の異なる複数の文書管理システム、電子メールやインスタント・メッセージング(IM)、さらにはブログやWebサイトに記載された情報までもマイニングの対象とするべく、テキスト分析ツールを導入する企業が増えている。


 その目的は、静的なBIリポートに新たな息吹を吹き込むことだ。テキスト分析ツールは、非構造化データであるテキストに埋もれている事実や考え方、データの関係を抽出したうえで構造化データに変換し、BIツールとの連携を図れるようにする機能を提供する。このツールを適切に活用すれば、主としてデータ・ウェアハウス(DWH)、あるいはERPやCRMといった大規模な業務アプリケーションから収集したBIデータのコンテキストと意味性を高めることが可能になる。


 一部の先進ユーザーは、テキスト分析とBIのコンビネーションが非常にパワフルであることを知っているのだが、まだ一般的ではないようだ。米国の市場調査会社Forrester Researchのアナリスト、ボリス・エヴェルソン(Boris Evelson)氏は、「プロセスとユーザー・インタフェース(UI)に関して言うと、ほとんどの人はBIと聞いて構造化データのみを扱うOLAP(Online Analytical Processing:オンライン分析処理)を連想するはずである。しかし、より価値のある分析結果を得るには、OLAPの際、ユーザーにシームレスなやり方で非構造化データを対象にする必要もあるのだ」と説明する。


 「事実、高度なBIシステムを構築するために多額の資金を投じていながらも、IT部門の幹部たちは、貴重な情報が格納されているデータの多くが、いまだ社内のあちこちに非構造化テキストのままで放置されていることにも気づいている」と指摘するのは、米国の市場調査会社Nucleus Researchのアナリスト、デビッド・オコーネル(David O'Connell)氏だ。


 社内に散在するデータには、マーケティングや販売キャンペーンの結果、顧客の購買傾向など、市場での競争上、非常に重要な情報が含まれている。しかし、これらのトレンドを見いだし追跡するには、分析を自動化してBIと組み合わせるしか方法はない、というのがO'Connell氏の持論である。


 「従来のBIツールにテキスト分析機能を“ボルト・オン”することで、BIの価値がさらに高まるのだ。しかも、データ・クレンジングの処理はわずかで済むため、莫大なコストがかかるようなこともない。これにより、最終的に既存のBIツールでROI(投資利益率)の向上を図ることができるようになる」(O'Connell氏)


事例が物語るテキスト分析ツールの威力

 テキスト分析と組み合わせてBIを拡張することのメリットは、米国テネシー州チャッタヌーガに本社を置く保険会社、BlueCross BlueShield of Tennessee(BCBS)の例を見ればわかりやすい。BCBSは、この2つのテクノロジーを効果的に連携させることで、4種の疾病カテゴリにおける高リスクおよび低リスクの保険加入者に対する保険コストの分析精度を高めることに成功している。


 「関連性の高い構造化データと非構造化データを組み合わせることで、業務を新たな視点から見られるようにし、新たな分析手法を可能にする。それらとともに、従業員に対しては、拡張BIという形で、より行動しやすい情報を提供できるようになった」と、BCBSでチーフ・データ・アーキテクトを務めるデータ・リソース/マネジメント担当シニア・マネジャーのフランク・ブルックス(Frank Brooks)氏は語る。


画面1:米国SAS Instituteのテキスト分析ツール「Text Miner」の操作画面


 BCBSのBIシステムは、カナダのCognosが提供する「Cognos 8 BI」をベースに、米国SAS Instituteの「Text Miner」(画面1)および米国IBMの「OmniFind Analytics Edition」という2種類のテキスト分析/マイニング・ツールによって構築されている。Brooks氏によると、2種類の分析ツールは、BCBSみずからが構築し運用するコンセプト証明アプリケーションで大きな役割を果たしているという。同氏はこう話す。


 「コンセプト証明アプリケーションの構築・運用の過程で、われわれは、非構造化データに隠された意味を、既存の構造化データにおける意味に変換できることを理解した」


 SASのText Minerは、複数のファイルタイプ(PDF、ASCII、HTML、Microsoft Word)に含まれているデータを操作し、特異値分解(Singular Value Decomposition)技術を用いてテキストを数値表現としてレンダリングする。これらの数値モデルは、Microsoft ExcelやSASの各種BIツールなど、BIクライアント・ソフトウェアにあらかじめ用意されている。


 一方、IBMのOmniFind Analytics Editionは、IBM Researchが開発した「UIMA(Unstructured Information Management Architecture)」を主軸にしている。UIMAは、非構造化テキストを「WebSphere Portal Server」や「Lotus Workplace」といったミドルウェアやシステムに統合可能なコンポーネントに変換するための言語処理を実行する際、コア・アルゴリズムを利用する(WebSphere Portal Serverなどのミドルウェア/システムは、大規模なBIアプリケーションの稼働環境となるケースが多い)。


 BCBSなどの大手保険会社に加え、金融サービス会社も、比較的早くからBIとテキスト分析の組み合わせに着目してきた。Forresterの調査リポートによると、テキスト分析はリスク・マネジメントなどの分野にも適用できるという。そのリポートでは、大手金融機関に勤める詐欺対策の専門家がBIとテキスト分析を用いて「監視リスト」を作り、法的開示文書をコンパイルした事例が紹介されている。データセットを手作業で関連づけていたら、この作業はまず不可能だったはずだ。


 米国の財務プランニング関連のSIベンダー、Kettley Publishingは、同社顧客である財務プランナーが最も関連性の高いコンテンツにアクセスできるよう、BIとテキスト分析の機能の連携を試みた。「BIとテキスト分析の組み合わせは強力だ。これらにより、“雑然としたデータ”を意思決定に役立つ形に変換できる」と、Kettleyの開発担当ディレクター、ジム・コノリー(Jim Connolly)氏は賞賛する。


 テキストを構造化するのにあたってKettleyでは、WWF(Windows Workflow Foundation)プログラミング・モデルを用いてテキスト分析機能を自社開発した。Connolly氏によれば、この機能は大規模なエンタープライズ検索機能にステップアップするための土台となるものだという。「実装はスムースに行き、所要期間も1人月未満だった」と同氏。


 「BIベンダーがこぞって自社の製品ポートフォリオにテキスト分析機能を追加するなか、こうしたシステムに対する企業側の関心を真っ先にビジネスに結び付けるのはSIベンダーだろう」と、ForresterのEvelson氏は解説する。


 「ただし、まだ統合が課題として残る。ソフトウェアに1ドル投資するとしたら、システムの統合に少なくとも3~5ドルはかかると見るべきだ」(同氏)
[PR]

by yurinass | 2008-03-05 08:04
<< アルピコ債務超過:労働団体、松... アルピコ債務超過:外部アドバイ... >>