【KYC コラム】「リスク情報収集AI技術」解体新書#4(1)

~KYCコンサルティングのコア・コンピタンス(競争優位の源泉)~

#4 リスク情報収集AI技術を解き明かす

(1)従来のリスク情報収集の実態と課題

今回のコラムでは、リスク情報の収集に焦点を当て、従来の収集方法の実態と課題について事例を用いて解説します。さらに、私たちが提供する「Risk Analyze」(リスクアナライズ)が、企業のコンプライアンスチェック業務にどのような効果をもたらすのか、についてお伝えします。

コンプライアンスチェック業務の効率化には、収集されたネガティブ情報の精査作業をなくすことが欠かせない 

 当社が提供するコンプライアンスチェックツール「Risk Analyze」は、企業や個人のバックグラウンドにおけるネガティブな情報の有無を調べるものです。企業においては、危機管理の一環として、新規契約や既存の取引先・顧客の本人性確認に用います。

 従来のコンプライアンスチェック業務においては、チェック方法が二通りに限られていました。一つの方法は、新聞記事のデータベースを用いた検索です。もう一つの方法は、インターネットを利用したブラウザ検索です。業務担当者は業務を遂行する中で、こられのチェック方法の不便さや使い勝手に課題を抱えていました。

 新聞記事のデータベースは、信頼性の高い情報源にアクセスできる利点があります。ですが、取引先のコンプライアンスチェックを行う際、企業名や個人名など、固有名詞を特定(完全一致)して的確に抽出することはできません。検索を実行すると、新聞記事のデータベース内において検索した「文字列」が存在するかどうかを判断します。存在すれば、文字列を含む全ての記事が抽出される仕組みです。

 例えば、取引先の代表者をチェックする際、氏名に加え、「逮捕」とネガティブ情報を入力し検索します。ここからは、具体的な固有名詞を例に用いて解説します。仮名「村上龍」と設定し、取引先の代表者として検索した場合、「村上龍」がキーワードとなり、その文字列が含まれる全ての情報を収集します。そのため、村上龍一や村上龍二なども検索結果に反映されます。

 コンプライアンスチェックの件数が増えるほど、その課題感と負担は大きくなります。従来のチェック方法で1,000件のチェックを行った場合、処理に要する時間は約40時間です。1件当たりに要するチェック時間が数分であっても、取引先件数が数千~数万件に上れば、費やす時間や労力、コストは決して軽視できません。コンプライアンスチェック業務を効率化するためには、不要な情報を判別し精査する作業を減らすこと、もしくはなくすことです。

地道で膨大な情報量の精査が、コンプライアンスチェックのハードルを上げ、取り組む意識を低下させる要因に

 その他にも不要な情報が収集される仕組みがあります。データベース内に「村上龍」という人物しか存在しない場合においても、業務担当者が意図する記事の内容と異なる記事が収集されます。検索の目的は、検索対象者の犯罪歴の有無であり、検索対象者が加害者である確証を得るため検索します。ですが、収集される記事には、「村上龍」が被害者である記事も同時に収集されるのです。また、新聞記事には、必ず記者の氏名が記載されます。その場合も「村上龍」という新聞記者が存在すれば、その記事は全て収集されてしまいます。

「Risk Analyze」は一つの企業に対して、会社名と個人名の二方向からネガティブ情報の有無を取得

 企業のコンプライアンスチェックは、契約前段階や契約時と併せて、年度末に全ての取引先や顧客を対象に行われます。契約後、企業や代表者の状況に変化がないか、年に一度、全ての契約先を確認することは、企業の重要な危機管理の役割を担っています。特に、全顧客のチェックに関しては、膨大な作業量になるため、作業の効率化が求められます。

 上場企業においては、通常、役員や監査役まで調べます。企業の規模が大きくなるほど、ステークホルダーの数も増え、関係する各会社や代表者、役員などを含めるとチェックの対象者は 相当な数に上ります。また、実質的な支配者となる大株主(取締役、監査役以外)の投資会社や事業会社などもチェックの対象として調べる必要があります。

検索の時点でネガティブな記事を判別 約20種類のキーワードを掛け合わせ各企業に適した検索式を設定 

 ネガティブ情報のキーワードに「逮捕」や「書類送検」などがあります。そうした検索ワードには、その業務を担う警察官の検挙情報や表彰情報など、コンプライアンスチェック業務には不要な記事が収集されます。通常の文字列の検索では、検索の時点で該当する記事がポジティブな記事かネガティブな記事なのか、判別できません。ネガティブなワードが含まれるものが全てネガティブな情報に該当するとは限らないので、記事内容を解釈する必要があり、従来の調査手法における大きな課題でした。

 そこで私たちは、必要な情報を的確に抽出する検索式を考案し、準備しました。検索式は、ノイズとなる不要な情報を省くための式と、必要な情報を収集するための式を主として、それらを約20種類のキーワードと掛け合わせて構築します。各企業の事業形態や要望に応じて、検索式を考案し、組み合わせて設定します。そのノウハウが私たちの担当者の腕の見せ所です。

 いくら検索式のノウハウを持っていても、不要な情報を全て取り除くことはできません。ですが、情報処理の分野における専門家の知識や技術力と、当社の培った危機管理分野の知識を掛け合わせることで、記載の仕方に規則性がない(キーワードが付随しない)犯罪者名に対しても、抽出率85パーセントを可能にするシステムの開発に成功しました。人間が文章を読み、読解する能力と同様の機能を機械に学習させることで、従来のチェック方法の課題の解決を図りました。

次回は、AI(人工知能)を用いて犯罪記事に特化した文章の読解を可能にした、最先端技術について解説します。