転職レシピ|Ph.D.とデータサイエンティスト(UKの物理学Ph.D.→データサイエンティスト→CEOになった柴田暁氏のご意見)

転職
博士・ポスドクは「科学的方法」をマスターした人材です。その強みを活かしましょう!

Ciao!みなさんこんにちは!このブログでは主に
(1)pythonデータ解析,
(2)DTM音楽作成,
(3)お料理,
(4)博士転職
の4つのトピックについて発信しています。

今回も天文学のポスドクだった私が、民間企業にデータサイエンティストとして転職する際に下調べした内容をまとめます。
2018年の転職活動開始当時、転職エージェントから「データサイエンティスト」という職種を進められました。
「データサイエンティスト」という言葉を初めて耳にした私は、自分なりに「データサイエンティスト」について調べて情報をまとめていました。

今回は、DataRobot Japanという会社のCEO兼データサイエンティストの柴田暁氏が「Ph.D.取得者がデータサイエンスを行うことの重要さ」を解説した記事を私なりにまとめて紹介します!
柴田暁氏の記事は、データサイエンス業務を改善したい企業向けに書かれたものですが、博士・ポスドクといったPh.D.取得者がどのような心構えで、どのような強みをアピールすればよいか考える上で参考になります!

民間企業への転職を考えている博士・ポスドクの方には、自身の強みを言語化したり、転職までに準備しておくべきことや転職後に得たい経験を整理するために参考にしていただけるでしょう!

Kaiko
Kaiko

この記事は以下のような人におすすめ!

  • 博士・ポスドクの強みは?
  • データサイエンス業務で博士・ポスドクはどう活躍できる?
  • データサイエンス業務に必要な人材は?

Abstract | データサイエンスに必要なのは科学者

データサイエンスには科学者が必要です。
データサイエンスとは、データを科学的な手法で分析し、新たな価値を創造する業務です。
データ分析を基に新たな価値を創造するには、既存のプロセスの自動化といったエンジニア的な方法では不十分で、問題設定、仮設設定と検証、試行錯誤といった「科学的方法」が必要です。
この科学的方法を習得した人材、科学的手法によって新たな価値を創造できる人材が科学者です。

Ph.D.取得者、すなわち博士・ポスドクは科学的方法をマスターした「科学者」と呼ばれる人材です。
科学的方法を駆使して、新たな知識を発見し、人類の知識の地平線を押し広げることができた能力と経験を持っています。
博士・ポスドクが民間企業に転職するならば、特にデータサイエンティストとして転職するならば「科学的方法を駆使して価値創造ができる」ことを強みとして主張すべきです。



Background | 物理学Ph.D.からデータサイエンティストになった柴田暁氏の略歴

今回は、DataRobot Japanという会社のデータサイエンティスト(当時)からCEOになられた(2020年11月より)柴田暁氏が「Ph.D.取得者がデータサイエンスを行うことの重要さ」をデータサイエンス業務を改善したい企業向けに解説した内容(「足りないのは、データではなくサイエンス」)を私なりにまとめて紹介します。

実験素粒子物理学Ph.D → 外資コンサル → データサイエンティスト & CEO

まずは柴田暁氏の略歴をごく簡単に紹介します(詳しくはこちら
柴田暁氏はロンドン大学で実験素粒子物理学の研究で2009年にPh.D.を取得されています。
その後は大手外資系戦略コンサルのボストン・コンサルティング・グループ(BCG)で定量分析を軸としたコンサルタントをされたのち、白ヤギコーポレーションというデータ分析サービスの会社を設立されたそうです。
2015年からDataRobot Japanにデータサイエンティストとして加わり、2020年からCEOになったそうです。

アカデミック系データサイエンティスト + アルゴリズム能力 + ビジネス能力

柴田暁氏は「データサイエンティストの3類型」でいえば、もともとアルゴリズム能力の高かったアカデミック系データサイエンティストにマーケター能力を足したような人材です。
もともとコンピューターサイエンスが好きだったことがきっかけで物理学の研究を始め、シミュレーションを行う計算ツールを開発するなどアルゴリズムにかなり明るい方のようです。
Ph.D.時代にすでにアルゴリズム能力の高いアカデミック系データサイエンティストとしての能力を獲得しており、そこにボスコンでコンサルティング能力を載せたという印象です。

転職活動以来、約3年ぶりに柴田暁氏の記事を読みましたが、ポスドクからコンサルに行っていることに個人的には親近感が沸いています。
私も将来は起業して独立したいと思っているので、見習うべきところがたくさんあります!



Contents | データサイエンスとPh.D.人材

以下では柴田暁氏の「足りないのは、データではなくサイエンス」という記事を、私なりにまとめてご紹介します。
データサイエンス業務におけるPh.D.人材、すわなち博士・ポスドクの必要性、博士・ポスドクのどのような能力が必要とされるのかをお話します!

データから新たな価値を生み出すにはサイエンティスト(科学者)が必要

収集されたデータから新しい価値を生み出すには、科学的なプロセスが必要です。
これまでのIT技術によるエンジニアリング的なプロセスでは、自動化・高速化・大容量化による業務プロセスの改善など、既存のプロセスを機械化するだけで価値が生まれていました。
しかし、大量のデータを収集できるようになった現在においては、そのデータからどのような価値を創造できるかが問われています。

暗示的なプロセスを科学的手法で明確化するのが科学者

収集されたデータから新たな価値を想像するには、明示的な既存プロセスではなく、「人間の感覚値」や「専門家の熟練」などの暗示的なプロセスを明確化する必要があります。
この過程には、

  • そもそもどのような価値を想像するのか(問題・課題設定)
  • システムやプログラムにどのようなデータを入力するのか(データ)
  • どの分析手法やアルゴリズムを採用するのか(方法)
  • 結果をどのように解釈し、どのような示唆を得るのか(解釈)

といった作業が発生します。
上記の作業を得意とするのがサイエンティスト = 科学者です。

科学的手法とはデータ分析から新たな洞察という価値を創造する作業

前述の科学的なプロセスは科学的方法として定義され、Wikipedia(科学的方法)に記載されています。
科学的方法の根幹となるのは以下のステップです。

  1. 解決するべき課題を設定する
  2. その課題に対して仮説を提唱する
  3. 仮説それが真であるときに現れる現象を導き出す
  4. 仮説を検証するのに有効な観測(データ)を取得・処理
  5. データと仮説が矛盾していないかどうかを検証
  6. 検証結果の信頼性と限界を把握する
  7. 実験の検証範囲内で実世界への洞察(インサイト)を導き出す
  8. 洞察が得られなければ、課題もしくは仮説を変えて何度も繰り返す
  9. 検証結果・インサイトを論文やモデルの形で公開する

つまり、課題を設定し、データ分析から新たな洞察という価値を創造する作業です。
これまでの私のブログ記事(「転職レシピ|博士は研究コアスキルを活かして民間企業で活躍できる」など)でも紹介している問題提起から解釈・解決までの「研究フレームワーク」と同じですね。



科学者になるための資格 = Ph.D.(博士号)

科学者になるためには、博士課程で「アカデミックトレーニング」を受けPh.D.もしくは博士号という資格を取る必要があります。
専門職に就くためには専門的な教育・トレーニングが必要です。
医者や弁護士にも資格があるのと同様に、科学者の資格はPh.D.です。
もっともPh.D.を与えるのは大学なので国家資格ではありません。
また、資格に応じた独占業務も存在しないので、特に日本では稼げる資格ではありません。
しかし海外に行くと「科学的方法を習得したプロ」として重宝されるようです(アメリカの知人から家賃交渉が有利になった話を聞いたことがあります笑)。

Ph.D.(博士号)の要件 | 科学的方法により人類の知識を押し上げたこと

Ph.D.を取得するための要件は「科学的方法を使って、ある研究分野において人類の知識を押し上げたこと」です。
Ph.D.を取るために行う作業をわかりやすく描いたものがこちらのウェブサイトに載っています。
下図1のように人類の知識は円で例えられます。
小学校を終えたときに得られている知識は青い丸の範囲です。
なにかの領域に特化したものではないため円形で、かつ小さな範囲の知識です。

図1. 全人類の知識を円で例える。小学校で得られる知識は一般教養のうち少量の知識。

修士課程までは知識のインプットがメイン

その後、下図2のように、中学、高校、大学と進むにつれて吸収できる知識の範囲は広がっていきます。
学部の後半になると、専門的な分野の知識を深めていくことになります。
学部の円から右上に伸びているのはこの部分の知識です。
修士課程ではその知識をさらに深く掘り下げます。
ここまでは、全人類の誰かが持っている知識を吸収する段階なので、インプットだけでも到達できることになります。

博士課程は人類の知識の果てに到達するためのアカデミックトレーニング

博士課程では専門知識をさらに掘り下げ、まだ誰も知らないレベルに到達します。
そのためには、科学的方法を習得して果てしない試行錯誤を行う必要があります。
当然、膨大な時間と労力がかかります。
これがアカデミックトレーニングです。

Ph.D.取得には新たな知識を発見し、人類にアウトプットすることが必要

博士課程を修了しPh.D.を取得するというのは、図2の右上の拡大図にあるように、ある専門分野のある一点において、全人類の知識の果てに到達し、知識の地平線を押し広げることができたことを意味します。
すなわち、誰も知らなかった知識を新たに発見して、査読論文や博士論文という形で人類に新たな知識を与えることができたことに対する称号がPh.D.です。
知識をインプットするだけでなく、新たな知識を発見してアウトプットすることが求められます。
このように、人類の知識の地平線を押し広げるためのプロセスを、物理学、天文学、化学、生物学、地学などの自然科学分野ではサイエンス=科学と読んでいます。
Ph.D.を取得したということは、科学的方法を使い、新たな発見をしたという証明になります。

図2. 中高、大学に進むにつれて知識の範囲が広がる。学部後期から修士課程では専門知識を深める。博士課程では誰も知らないレベルに到達する。Ph.D.は誰も知らないレベルの知識を新たに発見し人類の知識とできたことに与えられる称号。

科学的方法は一朝一夕では身につけられない

科学的方法は、セミナーや研修で身につけられる類のスキルではありません。
先人に教えを請い、粘り強く試行錯誤を続け、新たな知識を発見しアウトプットしてようやく得られるものです。
最近では「データサイエンティスト育成講座」といったセミナーや書籍を良く目にしますし、私自身もそのようなセミナーに参加することがあります。
しかし多くの場合、「このような統計学的な手法がある」、「Pythonを使ってデータを処理する」、「Rを使ってARIMAモデルを作る」といった技術的な内容に終止します。
このような技術に長けていることは有用ですが、これは科学的方法の中のごく一部に過ぎません。



Discussion | 博士・ポスドクの強みは科学ができること

博士・ポスドクの最大の強みは科学ができること、すなわち科学的方法(研究フレームワーク)を駆使して、新たな知識を発見し人類に還元する能力があることです。
博士・ポスドクから民間企業に転職するのであれば、「科学ができる」という強みを活かして転職すべきです。
データサイエンティストを目指すのであれば、「科学的方法でデータを分析し、新たな知見や価値を提供する能力がある」ことをアピールすべきです。

科学的手法をマスターしている博士・ポスドク人材の希少価値

柴田暁氏のご意見は、データサイエンス業務を改善したい企業向けのもので、氏はデータサイエンスの現場には、科学的方法を使える人材が必要であると主張しています。
もちろんデータサイエンス業務にはアカデミックな能力だけでなく、エンジニア能力、ビジネス能力を持った人材も必要です(3つの能力についてはこちらの記事をどうぞ)。
しかし、アカデミックな能力を持つ人材、すなわち科学的手法をマスターしている博士・ポスドク人材は、日本の企業においては圧倒的に少数派で人材不足です。
科学的手法をマスターしている人材は、日本のデータサイエンスの現場で最もニーズが高い人材と言っても過言ではありません。



Conclusion | まとめ

最後までご覧いただきありがとうございます!
実験物理学者からアカデミック系データサイエンティストになり、今はデータサイエンスの会社のCEOになられた柴田暁氏のご意見を紹介しました。

データを科学的に分析し、新たな価値を創造するためには、科学的手法をマスターした人材、すなわち科学者が必要です。
Ph.D.という称号は科学的手法をマスターし、新たな知識を発見し、人類にとっての新たな価値を創造した科学者に対して与えられるものです。
博士・ポスドクから民間企業に転職するのであれば、科学的手法を使ってデータから価値創造できるという強みを武器にすることで、転職後の活躍の可能性を高めることができます!
この記事を将来キャリアの方向性策定、強みの整理・言語化お役立てください!

以上、「転職レシピ|Ph.D.とデータサイエンティスト(UKの物理学Ph.D.→データサイエンティスト→CEOになった柴田暁氏のご意見)」でした!
またお会いしましょう!Ciao!

コメント

タイトルとURLをコピーしました