• コラム

リスク情報収集AI技術解体新書#1

  • KYCコラム
  • KYCC message
  • Solomon
  • RiskAnalyze
  • レグテックソリューションの今

〜KYCコンサルティングのコア・コンピタンス(競争優位の源泉)〜

#1「KYCの社会インフラ化」を実現するために

情報処理学会での受賞

 KYCコンサルティングは、2021年4月より、国立大学法人長岡技術科学大学(以下、長岡技術科学大学)と、野中尋史 准教授(2021年当時、長岡技術科学大学に所属/現在、愛知工業大学経営学部経営学科)が主催する「知識マイニング研究室」のスピンアウトベンチャー、株式会社マヨラボ(本社:新潟県長岡市、代表取締役:片岡翔太郎、以下「マヨラボ」)と産学共同で自然言語処理・AI(人工知能)を利用したリスク情報解析システムの研究・開発に取り組みました。

 その結果、リスク情報を体系化し自動でデータベース化するAIエンジンの開発に成功しました。その成果の一部を2023年3月、情報処理学会第85回全国大会(主催:一般社団法人情報処理学会)において「eKYC※1のための教師無し犯罪情報体系化手法の開発」と題して発表したのです。発表を務めたマヨラボのインターン生、百々優志郎氏(長岡技術科学大学大学院情報・経営システム工学専攻修士1年)が学生奨励賞を受賞しました。

※1 eKYCとは、electronic Know Your Customerの略で、電子本人確認と訳されます。

情報処理学会とは

 情報処理学会は、情報処理分野における日本最大の学会です。設立は1960年(昭和35年)とその歴史は古く、会員数は約2万人(2022年度)を擁します。「コンピュータとコミュニケーション」を中心に、知識処理、セキュリティ、ハイパフォーマンスコンピューティングなど、情報処理に関する学術・技術の進展を図っています。さらに、それらの普及活動を通して、学術や文化、産業の発展などに貢献することを目的としています。全国大会は年1回(春季)開催される、同学会最大のイベントです。最新の学術・技術動向、情報に関する新たな研究成果やアイデアに関する約1,200件の一般講演発表に加え、招待講演やパネル討論などで構成されます。

野中尋史准教授が主催する「知識マイニング」研究室とは

 「知識マイニング研究室」は、産業応用をテーマに幅広い分野・機関と連携しながら、AIを用いた膨大なデータ解析によって、社会課題の解決につながる研究を行っています。特にビッグデータ(量・多様性・速度を高いレベルで備え、人間では把握困難な巨大データ群)によるAIの利活用、マイニングの研究・開発においては、学会賞を受賞する研究成績を誇ります。中でも特許情報※2やウェブ情報に焦点を当てたテキストマイニング技術が強みです。

 「知識マイニング」は一般的に、「テキストマイニング」や「データマイニング」と呼ばれています。「統計学、パターン認識、人工知能などのデータ解析の技法を大量のデータに網羅的に適用することで知識を取り出す技術のこと」(参照:フリー百科事典『ウィキペディア』)です。

※2「特許情報」とは、特許・実用新案・意匠・商標の出願や権利化に伴って 生み出される情報です(参照:特許庁、第3章 特許情報の利用)。

大学発ベンチャー株式会社マヨラボとは

 2021年2月、同研究室に所属する学生メンバーらがAIシステムの社会実装を目的に、長岡技術科学大学発のベンチャー企業として、マヨラボを設立しました。主な事業内容は、テキスト・ウェブ分析技術や画像・動画分析技術を用いたシステムの受託開発、AIを用いた特許調査効率化システムの提供などです。マヨラボは共同開発において、自然言語処理を利用した反社会勢力・犯罪動向に関するAIを利用したウェブからの情報収集システムの開発を担います。

長岡技術科学大学との共同開発に取り組むまでの経緯

 KYCコンサルティングは、今後の情報流通社会の進展を見越し、複雑化している規制に対処するため、自然言語処理を専門分野にする研究者と共同で開発できる可能性を探っていました。ニュース記事のように、読解しやすく記載された文章も、情報処理技術を用いて機械的な処理を施すことで、精度の高い危機管理情報を効率的に取得する技術を構築したいと考えていたからです。

 長岡技術科学大学の理念である「社会実装の実現」と野中准教授の事業化を見据えた研究内容が当社が掲げるビジョンと重なり、共感と関心を抱いてもらえたことで、互いに求めていた出会いとなりました。

 知識マイニング研究室とマヨラボの専門性の高い知見や技術力と、野中准教授の研究成果の実用化を目指したビジネス感覚、さらに当社が培ってきた危機管理の専門知識やレグテック※3技術を組み合わせることで、「KYC(Know Your Customer)の社会インフラ化」が実現できると確信しました。

※3 RegTech(レグテック)は、2015年ぐらいから英国・米国を中心に使われ始めた規制(Regulation)と技術(Technology)を組み合わせた造語です。

2年間にわたる共同開発の歩み

 AIによる情報収集・解析システムの開発段階で、特に苦労した技術的な課題が二つあります。一つは、ウェブ上のニュース記事やSNS(交流サイト)などから犯罪者名を自動で抽出することです。記載の仕方に規則性がないため、犯罪者の特定を機械的に処理することはとても困難でした。

 二つ目は、犯罪内容と罪状についての自動解析です。例えば、「師匠の財布を盗んだ」と「師匠の技を盗んだ」のような記載に対して、機械的に判別処理を施す部分です。汎用的に文章自体を読解して、答えを出す高度なプロセスを要しました。

 完成したシステムは、記載の仕方に規則性がない(キーワードが付随しない)犯罪者名も、抽出率85パーセントまで高め、的確な抽出を可能にしました。また、詳細な罪状の記載がないものについても、どのような罪に該当するかAIが判断します。今後も、的確な抽出が難しい残りの15パーセントの言語表現に対して、いかにして100パーセントの抽出処理を施せるか研究・開発に注力します。

 次回は、野中准教授のインタビューをお届けします。野中准教授の経歴、研究内容に始まり、大学の立場から当社との共同開発に関して語ってもらいます。