【レポート】企業変革実践シリーズ第15 回「データサイエンスのこれまでとこれから」~データ活用の本質を改めて考える~

2021年11 月10日(水)、DBICでは企業変革実践シリーズ第15回として「データサイエンスのこれまでとこれから ~ データ活用の本質を改めて考える~」をオンラインで開催しました。10月からスタートした「Data Business Lab 2021 アナリティクス基礎 2021年10月期」の講師でもある堅田洋資氏をお招きし、データ活用の本質に迫る目的で開催したものです。
近年、国内でもデータサイエンス学部の新設、大学入学共通テストで「情報」という新科目が追加されるなど、学校教育の中でもデータサイエンスが徐々に広がりを見せています。また、産業界に目を移すと、AIを利用するシーンが増え、社員教育に力を入れるなどデータ活用を急ぐ企業も増加しています。しかし、データ活用はどのような価値を生むのか?そして、その価値を享受するのは誰なのか?こうした観点から堅田さんにお話しを伺いました。

今回のセミナーは、「データ活用の本質とは何か?」という問いに対して、参加者と一緒に考えていきたいという主旨で進められました。堅田さんによれば、現在、国内のすべての大学生および高校生がAI・データサイエンスを学べるようにする取り組みがなされようとしています。実際、2025年からは大学入学共通テストで「情報」が追加されることが決まっており、その第1歩の「プログラミング教育」がスタートしています。データサイエンス教育も近年活発化していて、すでに滋賀大学や横浜市立大学、武蔵野大学が先陣を切っており、現在、年間3万5,000人のデータサイエンス人材が生まれていて、徐々に増加しているようです。

次のテーマは、「データ活用、AI、データサイエンスとは何か」。堅田さんによれば、インプットデータと教師データの間にある関係を結ぶのがAI(機械学習)で、アルゴリズムにこの2つのデータを食べさせる。最初は、デタラメな予測値を出すそうですが、「答えはコレですよ」ということを繰り返し教えていくと、教師データとの誤差が小さくなるように自動的に修正していくそうです。「データとは何か」。これは世の中で起こっていることのスナップショットを蓄積したものがデータだと堅田さんは定義しているそうです。データには、構造化データと非構造化データがあり、前者は、アンケートデータ、取引データ、顧客マスター、従業員マスター、商品マスターなどが、後者は、画像データ、テキストデータ、動画や音声データなどが代表例とのことです。データサイエンスとは、課題があって、人間が仮説をつくって、仮説を検証するためにデータを活用する。もしくはデータから仮説を探索したり、生成することもある。そうした中で仮説を更新したり、起こっていたことを使って解決するという作業をしている。
こうしたことから、堅田さんは、データサイエンスは「営み」と呼んでいるそうです。そのデータサイエンスの営みにもレベルがあると言います。1)現状把握をするための記述統計学 2)関係性・因果把握をするための推測統計学 3)予測するための機械学習 4)処方的処置・対策のための最適化・シミュレーション の4つのレベルとのことです。

この後は事例紹介で、堅田さんの会社が関わったものとして、健康靴を扱うお店の顧客分析の事例を紹介してもらいました。横浜市にある健康靴の販売会社で、年商は10億円くらいの規模。社長や常務が店頭に立って接客しており、ドイツなどから高級な健康靴を仕入れて、顧客の足にフィットする靴をコンサルティングしながら販売している。ただし、現在は、スニーカーブームに押されて売り上げは減少傾向、コロナ禍の影響で一段と低迷しており、堅田さんの会社に対して、低迷した売上高をいかに伸ばすかという課題が与えられたそうです。
この会社は、ID-POSデータを収集していたことから、堅田さんらはこのデータを使って、優良顧客の分析を実施。そのデータをさらにセグメント化したそうです。その結果、判明したのが当初予想していた医療目的で購入した人の割合が30%だったこと。データ分析によれば、通常目的で婦人靴を購入する人の方が圧倒的に多かったことが判明したわけです。もともと、病院からの紹介で顧客を伸ばしていたそうですが、それからは病院との連携強化よりも、出店強化に方針転換することにしたそうです。お店で常にお客さんと接しているからといって、全体像がみえているとは限らないということがこの事例からの学びだと言います。

次のテーマは「私たちはあらゆることを、AI・機械学習で予測したり、レコメンドできるのか?」 その中で、紹介されたのが、コロナ禍の影響でこれまでの手法による需要予測が困難になった事例でした。その典型が、ビールの需要予測だったそうです。AIを使ってもまったく当たらないので、手作業で行うしかなかったそうです。

もう1つ考えるべきこととして堅田さんは、AIの倫理について話されました。2017年以降、AIの倫理に関する原則の制定がEUや北米を中心に活発化しているそうです。AIの倫理に関する問題はデータに起因する問題として、差別や偏見、プライバシー問題、一方、モデルに起因する問題として、ブラックボックスであるという問題が注目されているそうです。
そのうち、データに起因する問題が昨今、注目されており、差別や偏見では、アップルとゴールドマン・サックスが共同発行しているクレジットカードの「アップルカード」に触れ、男性の利用限度額より、女性の利用限度額が不当に低いことが発覚したケースを紹介。また、アマゾンが開発した人材採用AIで、学習したデータのほとんどが男性からの履歴書だったため、"女性"というだけでスコアが下がるAIとなった事例が話題になっているとのこと。
そうしたこともあり、最近ではAI倫理に関するガイドラインやコミットメントを出す団体やIT企業が増えつつあるそうです。具体的には、内閣府の「人間中心のAI社会原則」、NEDOの「機械学習品質マネジメントガイドライン」、ソニーの「ソニーグループAI倫理ガイドライン」、富士通の「富士通AIコミットメント」などが紹介されました。

最後のまとめとして話されたのが「データ活用の本質とは」について。堅田さんによれば、データサイエンスは、興味の対象を取り巻く様々な要素をデータで把握し、その構造を解き明かす営みである。具体的には、仮定の置き方こそが重要であり、データにならない感性、好奇心や直感が大切で、それを言語化することが大切。また、組織でデータ活用する意義とは、変化の早い外部環境を素早く察知して、現場での意思決定のスピードや精度をあげるためにデータを使うこと。データ分析は「データ+仮定」であり、仮定に対しての健全かつ率直な議論ができることが大切。そのためには多様な意見を引き出す組織文化が必要になる。スキルの獲得だけではなく、信頼関係をもとにした心理的安全性の高い組織文化の育成が大切になる、ということでした。

【スピーカーご紹介】

堅田 洋資(かただ ようすけ)氏
株式会社データミックス代表取締役
日本では数少ない米国大学のデータサイエンス修士号を保有。データミックスではこれまで400名以上の社会人に対してデータサイエンスやAIに関するトレーニングを行う。 また、大手企業からスタートアップまでデータサイエンス組織に関するコンサルティングやアルゴリズム開発の支援を行う。データミックス設立前は、監査法人トーマツにてデータ分析コンサルタント、生体センサスタートアップでサービス・アルゴリズム開発の取締役、KPMG FASにて事業再生コンサルタント、外資系メーカーでの経理・マーケティングなど幅広い経験を持つ。
University of San Francisco, M.S. in Analytics修了。一橋大学商学部卒業(統計学・データサイエンス専攻)。

他のDBIC活動

他のDBICコラム

他のDBICケーススタディ

一覧へ戻る

一覧へ戻る

一覧へ戻る

このお知らせをシェアする