コーヒータイム -Learning Optimism-

本を読むということは、これまで自分のなかになかったものを取りこみ、育ててゆくこと。多読乱読、英語書や中国語書もときどき。

現代の錬金術師『Journey to Data Scientist』

データサイエンティスト。

聞いたことがあるけれど、なにをしているのかよくわからない職業。データのスペシャリストであることはなんとなくわかる。

わたしが今仕事上ぶつかっている問題に役立つかもしれないと思い、本書を読んでみた。

本書は最先端企業で働くデータサイエンティストへのインタビュー集である。著者自身もデータサイエンティストを目指しており、自分自身の成功のために先輩諸氏に聞きまくったことを一冊の本にまとめた。

さっと読んでみたところ、データサイエンティストとは、数学、統計学、各種プログラミング言語を自在に操り、山積みのデータを処理して、経営判断に役立つものを錬成する人々のことらしい。ーーなぜか漫画《鋼の錬金術師》の中で、高度な錬金術知識を駆使し、よくわからないがらくたの山から素晴らしいあれこれを錬成する場面が思い浮かぶ。素人目線のわたしにはデータサイエンティストの情報処理技術が錬金術に見える。

鋼の錬金術師 1巻 (デジタル版ガンガンコミックス)

鋼の錬金術師 1巻 (デジタル版ガンガンコミックス)

 

読み進めてみると、データサイエンティストが苦労するのは、プログラミングにとどまらず、良質のデータを得ること、データサイエンティストではない人々に自分の成果を説明することなども含まれるらしい。確かにそうだろう。デジタル化が進んだのはたかだか20年程度のことで、その前のデータは手書きだったり紙記録だったり、コンピュータに取りこむだけで一苦労。一方で出てきた結果も説明に困るものだったりする。

たとえば有名なウォルマートビッグデータ活用例。いきなり「統計手法による解析の結果、ビールとオムツの売れ行きに相関関係があることがわかりました」と言われても、担当者はぽかんとするだけだろう。「主婦たちがダンナに赤ん坊のオムツを仕事帰りに買ってきてくれと頼むと、ダンナはたいていオムツのついでに自分のビールも買って帰るらしいことがわかった。だからオムツが売れるとビールもついでに売れる。もっと手に取りやすいように、オムツとビールの売場を隣同士にしてみましょう」と説明できてようやく担当者は納得する。担当者は統計学には詳しくないが、消費者心理の見方から説明すると理解できるからだ。

だからデータサイエンティストはこの方向から説明できなければならない。インタビュイーの一人が言っていたが、データサイエンティストはプログラマーであり、理論家であり、統計専門家であり、そしてコミュニケーションスキルに優れたビジネスパーソンでなければならない。

データサイエンティストは、わたしが面している問題を一部解決してくれそうだ。だが、データサイエンティストだけで解決出来ることではなさそうだから、まだまだ探し続ける。