「データ活用?#25569;?#22721;をどれだけ無くせるか。それが企業の競争力に直結?#24037;搿埂?#19977;井住友銀行の高橋大輔データマネジメント部情報活用グループ長はデータ分析の環境を整備?#24037;?#37325;要さをこう訴える。

 三井住友銀は2019年3月、米ベンチャーのトライファクタ(Trifacta)が開発した分析データの準備?#26411;`ル「Trifacta Wrangler Enterprise?#24037;?#21033;用を始めた。「ずっとこういう?#26411;`ルを探していた?#24037;?#19978;岡裕システム統括部上席部長代理は話す。「シリコンバレーで米国の技術動向を調べる組織経由でついに見つけた」。国内では初の本格導入事例となる。

三井住友銀行の本店(東京?千代田)
(出所:三井住友銀行)
[画像のクリックで拡大表示]

超大量データからデータを漏れなく抽出

 トライファクタの?#26411;`ルは機械学習モデルの構築といった「データ分析作業?#24037;?#21069;に、大量のデータから一部のデータを不整合なく簡単に抽出?#24037;?#27231;能を持つ。「データプリパレーションソフトウエア?#24037;?#21628;ばれるソフトの1種だ。

 取り出し元のテーブルを指定し、抽出の条件や加工?#24037;?#26041;法を指定?#24037;毪取?個のテーブルにまとめた分析用データを生成?#24037;搿UI(グラフィカル?ユーザー?インターフェース)で加工結果を確認しながら設定できるため扱いや?#24037;い韋?#29305;徴だ。

米トライファクタのデータ準備?#26411;`ルの画面例
(出所:三井住友銀行)
[画像のクリックで拡大表示]

 三井住友銀は約3年前の2016年4月に「データマネジメント部?#24037;?#35373;置し、銀行が大量に保有?#24037;毳簽`タの積極活用に乗り出した。2018年7月にはNECから独立した米ドットデータ(dotData)が開発した、機械学習モデルの作成プロセ?#24037;駻I(人工知能)で自動化?#24037;毳末`ルを導入?#24037;毪勝嗓筏啤ⅴ簽`タ分析業務の効率化を進めてきた。高橋グループ長は「データ分析で勝っていかなければ企業として?#26410;?#32154;が難しいという危機感がある?#24037;?#35441;す。

 三井住友銀は「顧客?#24037;洹?#24215;舗?#24037;勝?#25968;千万件規模のマスターデータ群?#21462;ⅰ?#26222;通預金?#24037;洹?#25237;資信託?#24037;勝?0億件超のトランザクション群を抱える。データを基に顧客のニーズをつかんでマーケティングに生かしたり、データを与信管理に生かしたりといった取り組みを進めるに当たり、10億件規模の元データをそのまま分析対象と?#24037;毪韋?#21177;率的ではない。統計的に有意な100万件程度を抽出?準備したうえで、分析?#24037;?#24517;要がある。

 ただ、データ分析の重要性が高まるなか、データを準備?#24037;?#20316;業の負荷が高い点が課題になってきた。「分析業務全体の3割を占めるほどになっていた」(上岡上席部長代理)。

 例えば毎月数億件に達?#24037;?#26222;通預金のトランザクションデータの中から100万件を取り出す場合、その100万件に関連?#24037;毳蕙攻咯`データも抽出?#24037;?#24517;要がある。そのうえでデータの型を統一したり、欠損した情報を補完したり?#24037;搿!弗ぅ螗咯`ネットバンキングの利用回数?#24037;?#36861;加?#24037;?#22580;合にはそのデータも100万件に関連?#24037;毪玀韋坤?#21462;り出さなければならない。

この先は有料会員の登録が必要です。今なら有料会員(月額プラン)が4月末まで無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関?#24037;隖AQはこちら