「予測モデル派」の技術者 vs 「可視化派」の事業現場&僕

事業会社でデータサイエンティストとビジネスサイドの中間で働くようになり、技術者(データサイエンティスト)がやりたいと思うことと、事業現場がやりたいと思うことの乖離の大きさに衝撃を受けることが多くあります。

そこで、今回はこんな記事を書きたいと思います!

対象読者

  • AIでどんなことができるのか知りたい方
  • データ活用後進企業で、データサイエンティスト⇆事業現場のすれ違いにお悩みの方
  • データ活用後進企業への転職を考えているが、現場との関わり方に不安のある方

記事の内容

  1. AIで解決できること
  2. 技術者がやりたいこと
  3. 事業現場が求めていること

言いたいこと

  • AIでできることは、A. 可視化、B. 予測、C. 最適化の3つ
    • A. 可視化:課題の所在を把握できます
    • B. 予測:将来何が起こるかを予測できます
    • C. 最適化:将来どんなアクションをすべきか提案できます
  • 技術者はアクションに近いB. 予測やC. 最適化を選びたがる
  • 事業現場はそもそもの課題の所在が分かってないからA. 可視化をやりたがる
  • 課題の所在がわからない限り、B. 予測やC. 最適化をやっても良いアクションにつながらないので、最初は我慢強くA. 可視化をやりましょうよ!

1. AIが解決できるテーマ

受け売りですが、 (ビジネス現場で使用される)AIができることは大きく分けて3つあります。A. 可視化、B. 予測、C. 最適化の3つです。便宜上、B, C, Aの順に説明します。

B. 予測

ある確率や数量、分類を占う問題が該当します。例えば、予測により下記のような問いを解決することができます。

  • ”XX”な状況の時、「YY」はどうなるか?
    • ”Aさんに商品B”をレコメンドした場合、「買ってくれる確率」は?(確率)
    • ”明日の株X”の「株価はいくら」になりそうか?(数量)
    • ”ネット上の匿名のAさん”は「男か女か」?(分類)

C. 最適化

最適なアクションに答える問題が該当します。例えば、下記のような問いを解決することができます。

  • 「YY」を最適化するのは、”XX”がどんな状況の時か?
    • 「Aさんに商品を買ってもらう確率」を最大にするには、”どの商品”をレコメンドするのが良いか?
    • 「明日の株式資産」を最大化するには、”どの株をいくつ売って、いくつ買う”のが良いのか?
    • 「サークルの女性比率」を最大化するには、ネット上で”誰を”にメールを送るのが良いか?

まどろっこしく”XX”、「YY」を使って記述しましたが、最適化の問題を解くためには、”XX”な状況の時に、「YY」がどうなるか、が分かっていなければならないので、B. 予測の延長上として、C. 最適化があることが理解できます。

スライド1.jpg

A. 可視化

過去に起きたこと(特に課題認識が強い事象)を説明する問題が該当します。例えば、下記のような問いを解決することができます。

  • 【ZZ】が発生したのはなぜか?
    • 【昨年、売上高が減少】したのはなぜか?
    • 【自社の利益率が他社よりも低い】のはなぜか?
    • 【最近、サークルの参加人数が減少した】のはなぜか?

例えば、1番目の例ですと、可視化によるアウトプットのイメージとしては、「売上高の減少の要因を紐解いた結果、顧客単価が下がっていることが原因であることが分かった」、といったことが当てはまります。さらに顧客単価が減少してしまった顧客の特徴を深掘りしていくと、「20代の人に、明らかに30代向けの商品をレコメンドしていた」、なんてことがわかるかもしれません。ここまで来てはじめて、「”Aさんに商品B”をレコメンドした場合、「買ってくれる確率」は?(確率)」という問いを、お金を出してでも解く意味が出てきます。

スライド2.jpg

2. 技術者がやりたいテーマ

少し前置きが長くなってしまいましたが、弊社の技術者(データ分析PJを実行するポジションの人間を想定しています)がやりたがるテーマは、B. 予測が多いです。もちろん人によりますが、中には、意味が無さそうなテーマでも、B. 予測を押す方もいます・・・笑。

技術者がやりたいテーマを考える前に、テーマ別に求められる要件と、それによるインパクトを整理してみます(以下、個人的な感覚での整理になりますことをご了承ください)。

要件とインパクトA. 可視化B. 予測C. 最適化
要件①:
機械学習の知識
△:
機械学習的な手法を用いることもあるが、用いないことも多い
◎:
予測モデルを構築・評価するために機械学習の手法の知識が必要
◎:
(厳密には機械学習手法ではないが)最適化手法の知識が必要となる
要件②:
ドメインの知識
◎:
課題を深掘りしていく過程でドメイン知識が必要となる
△:
目的変数、特徴量の設計で必要だが、可視化ほどではない
△:
最適化するパラメータを決める工程で必要だが、可視化ほどではない
要件③:
データの有無
△:
最低限課題を特定したい対象に関連するデータが必要(管理会計のデータなど)
◯:
予測対象に関するデータが必要(Aとは別のデータセットであることが多い)
◎:
最適化する対象に関するデータが必要(過去に実施した施策、実施状況と効果等)
インパクト(短期目線)△:
短期的な効果は薄い。可視化によって課題を特定できたとしても施策を打てなければ成果と言いにくい
◎:
予測対象が施策に結びつく場合、他手法に比べてすぐに効果が出やく、成果出たと言いやすい
◎:
最適化対象が施策に結びつく場合、他手法に比べてすぐに効果が出やすく、成果が出たと言いやすい

テーマ別に差がつく要件として、①機械学習の知識、②事業ドメインの知識、③データの有無、が挙げられるかと思います。この中で、技術者がリスクと感じるのは、要件②・③だと思います。②ドメイン知識に関しては、事業サイドのコミットメントに依存するところですし、③データに関しても当たり前ですが、蓋を開けてみないと(実際に分析してみないと)分からない部分があります。ですので、要件サイドから見ると、A. 可視化、C.最適化 が極端で、B. 予測がバランス取れているように思えます。

次に、インパクトから見ると、A. 可視化は、それだけで効果が出たと言いにくく、B. 予測、C. 最適化に見劣ります。A. 可視化の成否は、事業ドメイン知識に寄るところが大きいと申し上げたましたが、ゆえに、もし成功してもプロジェクトの成果と言いにくい部分もあるかもしれません。

結果、技術者目線で、リスクとリターンの秤にかけるとB. 予測モデルが選ばれるのだと思います。

3. 事業現場が求めているテーマ

こちらに書きました!

コメントを残す