転職レシピ|データサイエンティスト3類型(博士・ポスドクの研究経験を活かすアカデミック系データサイエンティスト)

転職
類型によって能力要件が異なります

Ciao!みなさんこんにちは!このブログでは主に
(1)pythonデータ解析,
(2)DTM音楽作成,
(3)お料理,
(4)博士転職
の4つのトピックについて発信しています。

今回はデータサイエンティストの類型と博士・ポスドクとの適合性についてお話します。
データサイエンティストと一言でいっても、どのような能力をもっていて、どのような業務に携わっているのかピンとこない方も多いのではないでしょうか?
私の勤め先も含め、データサイエンティストの定義はかなり曖昧です。
広い意味では、統計学的な分析をする者、プログラミングができるエンジニア、分析をもとに提案するコンサルタントもデータサイエンティストに含まれます。

データサイエンティストは、その得意領域に基づいて3類型に分類され、求められる能力(能力要件)が異なります。
この記事では、それぞれの類型がどのような特徴を持ち、どのような能力が求められるのかをご紹介します。
博士・ポスドクからデータサイエンティストを目指す上でのポイントをお話します!

  1. Abstract | 博士・ポスドクの研究経験を活かせる類型から入る
  2. Background | 定義が曖昧なデータサイエンティストという職種
  3. Contents | データサイエンティストの3類型と求められる能力
    1. アカデミック系データサイエンティスト(Quantitative Researcher: QR)
      1. アカデミック系データサイエンティストの能力要件
        1. 統計学の知識、統計学の適用方法の知見・経験・洞察力
        2. 実際の分析経験と試行錯誤の経験
        3. 誤差を理解・解釈できる
        4. 誤差を使えること(結果の信頼度を評価できる)
    2. エンジニア系データサイエンティスト(Quantitative Engineer: QE)
      1. エンジニア系データサイエンティストの能力要件
        1. アルゴリズムや基盤の知識 + 数理統計の知識
        2. アルゴリズムや基盤の研究開発ができること
    3. マーケター系データサイエンティスト(Quantitative Analyst: QA)
      1. マーケター系データサイエンティストの能力要件
        1. データ分析とビジネス課題解決を結びつけること
    4. データサイエンティスト3類型の違い
      1. アカデミック系データサイエンティストとエンジニア系データサイエンティストとの違い
      2. アカデミック系データサイエンティストとマーケター系データサイエンティストの違い
  4. Discussion | 博士・ポスドクが目指すべき類型
    1. 博士・ポスドクの優位性
      1. アカデミック系データサイエンティストに求められる能力 = 自身の強み
      2. ビジネス経験の不足は積極的な転職理由として活用しよう
  5. Conclusion | まとめ
  6. References | 参考

Abstract | 博士・ポスドクの研究経験を活かせる類型から入る

博士・ポスドクからデータサイエンティストを目指すならば、研究経験を活かせる類型のデータサイエンティストから入ることをお勧めします。
データサイエンティストには、

  1. アカデミック系データサイエンティスト
  2. エンジニア系データサイエンティスト
  3. マーケター系データサイエンティスト

の3類型があります。
どの類型でも、データを科学的に分析することで価値を生み出す(=社会課題を解決する)データサイエンスという業務を行うことは共通していますが、軸足を置く能力や最も価値を発揮できる領域が異なります。
中でもアカデミック系データサイエンティストは、統計学の知識や経験を駆使してデータサイエンスを行います。
統計学の理論的背景を知っているだけでなく、実際に実験データや観測データに分析を適用して試行錯誤した経験が求められます。

アカデミック系データサイエンティストなら博士・ポスドクでの研究経験が活かせるため、博士・ポスドクからはこの類型のデータサイエンティストを目指すことをお勧めします。
転職活動中には博士・ポスドクでの研究経験をデータサイエンティストとして働く上での強みとしてアピールすることができます。
転職後も軸足を置く能力や発揮できる価値が明確なため、適切なプロジェクトに入れてもらいやすくなり活躍できる可能性が高まります。
民間企業のアカデミック系データサイエンティストとして活躍するためには、博士・ポスドクの研究で身につけることが難しいビジネス経験も必要です。
しかし、ビジネス経験がないから不利になるわけではなく、「ビジネス経験を積むために御社で働きたい」ぐらいのことが言えれば積極的な転職動機として利用することができます。

 



Background | 定義が曖昧なデータサイエンティストという職種

近年では様々な業種の企業でデータサイエンティストの募集が行われていますが、求められる能力(能力要件)が曖昧です。
求人票を見るとデータサイエンティストの求人でも、よくよく中身を見ると

  • 事業コンサルタントの募集だった
  • 画像解析技術者の募集だった
  • 研究開発(R&D)スペシャリストの募集だった
  • Webアプリ開発の募集だった
  • 機械学習エンジニアの募集だった

ということもしばしばあります(最後のはデータサイエンティストの一つの類型ですが)。
そもそもデータサイエンティストとはどのような人材なのか世間では理解されていないおらず、能力要件がまともに定義されていないと考えられます。

博士・ポスドクからの転職でデータサイエンティストになる場合、データサイエンティストの類型と求められる能力を理解していないと、

  • 適切な求人に出会えない
  • 適切な求人を選べない
  • 自分の強みをアピールできない(企業のニーズとマッチングできない)
  • 転職後に適切なプロジェクトに入れてもらえず活躍できない

といった弊害が起こりえます。
研究者にも、理学系、工学系、薬学系などの分類があり能力要件は異なります。
もっと細かく言えば、天文学者でも観測系、理論系、装置開発系など研究の方向性によって能力要件が異なります。
データサイエンティストでも同様に、どのようなアプローチで業務に取り組むのかによって能力要件が異なります。

この記事では、データサイエンティストを大きく3類型に分類し、それぞれの類型で求められる能力や博士・ポスドクから転職する際のポイントをご紹介します!



Contents | データサイエンティストの3類型と求められる能力

データサイエンティストには

  1. アカデミック系データサイエンティスト:
    統計学・数学を軸に活動する者(Quantitative Researcher: QR)
  2. エンジニア系データサイエンティスト:
    アルゴリズムと基盤の開発・実装を軸に活動する者(Quantitative Engineer: QE)
  3. マーケター系データサイエンティスト:
    ビジネスの視点を軸に活動する者(Quantitative Analyst: QA)

の3類型があります。

データサイエンスとは、データを科学的に分析することで価値を生み出す(=社会課題を解決する)業務です。
この業務にどの方向からアプローチするか、あるいは、どの軸にオリジン(出自)を持つデータサイエンティストなのかで上記の3類型に分けられます。
チームでデータサイエンスプロジェクトを進める場合は、これら3類型の人材がバランス良く配備されているチームを作ることでチームの能力を最大化することができます。
1人や少人数でデータサイエンスプロジェクトに当たる場合には、不足している類型の部分をカバーするよう勤める必要があります。

ちなみに、この分類のオリジナルはデータサイエンティストの尾崎隆氏によるものです(参考→こちら)。
「Quantitative xxx」とはグローバルな企業でデータ分析関連の職種を表す言葉で、「定量的にxxxする人」という意味です。
今回は解釈しやすいように私なりに「xxx系データサイエンティスト」と言い換えてみました。

アカデミック系データサイエンティスト(Quantitative Researcher: QR)

アカデミック系データサイエンティストは、統計学の知識や経験を駆使してデータサイエンスを行います。
統計学を使ってデータの裏側にある真実を導き出そうとする人で、一言で言えばデータ分析を使ってサイエンスをする者です。
このタイプのデータサイエンティストは、statisticianとも呼ばれます。
データサイエンティストが21世紀の最もsexyな職業であると謳われています(Harvard Business Review)が、この記事の中でGoogleのチーフエコノミストのHal Varian氏は「次の10年で最もsexyな職業はstatisticianである」と述べています。
つまり、データサイエンティスト = 21世紀の最もsexyな職業という文脈においては、狭義のデータサイエンティストはアカデミック系データサイエンティストであると言えます。

アカデミック系データサイエンティストの能力要件

統計学の知識、統計学の適用方法の知見・経験・洞察力

アカデミック系データサイエンティストに必要な能力は、統計学の知識、統計学の適用方法(追求したい事柄について、データに対してどのように適用するべきか)の知見・経験・洞察力です。
このタイプのデータサイエンティストには、

  • 問題設定が与えられたとき、どのようなデータを集めるべきか考案すること
  • 問題設定とデータからどのような分析手法を選択すべきか考案すること
  • ある分析手法がうまく行かなかったときに、別の手法を考案すること

が求められます。
そのためには、統計学的分析の手法を知っていることに加え、それぞれの手法にどのような理論的背景があり、どのような場合に有効で、どのような長所・短所を持っているのかを理解している必要があります。

実際の分析経験と試行錯誤の経験

また、統計学の理論的背景を知っているだけでなく、実際に実験データや観測データに分析を適用して試行錯誤した経験が求められます。
分析がうまく行かないときに別の手法を試したり、解釈が難しい結果が得られたときに追加の分析・調査をして結論を導くには試行錯誤の経験が必要です。
そこで、博士・ポスドクでの研究経験やデータサイエンス業界での実務経験が重要視されます。
観測天文学の出身の私も博士・ポスドクでの研究経験を活かして、この分類データサイエンティストとして活躍しているつもりです。

誤差を理解・解釈できる

統計学の適用方法の知見として重要なことをひとつ挙げるとすれば、誤差の解釈ができることです。
データサイエンスの現場では、実際に分析をして想定通りの結果が得られないことが良くあります。
そのような場合に、

  • 想定とずれてしまった要因は何か
  • そのずれから得られる示唆は何か

ということを考える能力が必要です。
例えば、モデルを当てはめて当てはまりが悪かった場合に、サンプル数が少なすぎたのか、サンプルが偏っているのか、そもそも仮定したモデルが良くなかったのかなどの要因を切り分けて検証できる能力が求められます。

誤差を使えること(結果の信頼度を評価できる)

想定通りの結果が得られたとしても、統計学的にその結果がどのくらい信用できるか評価できる必要があります。
実験や観測の現場では、サンプル数が限られているなど、結論がデータに制限されるという状況が頻繁に発生します(というよりも通常はそうです)。
ビジネスの現場でも同様で、無限にデータを取得できる状況はなく、大抵は結論がデータに制限される状況になります。
そのような状況で、得られた結果がどの程度信用できるのかを評価し、示せる必要があります。

エンジニア系データサイエンティスト(Quantitative Engineer: QE)

エンジニア系データサイエンティストは、データを分析するためのアルゴリズムと基盤を研究開発し、その上で実装することでデータサイエンスを実現する人です。
一言で言えば、データ分析の研究をする者です。
機械学習や最適化などのアルゴリズムの研究・開発し、さらに開発したアルゴリズムを本番環境に実装するということができるエンジニアです。

エンジニア系データサイエンティストの能力要件

アルゴリズムや基盤の知識 + 数理統計の知識

エンジニア系データサイエンティストに必要な能力要件は、アルゴリズム、コンピュータサイエンス、アルゴリズムの実装に関する知識、さらに、アルゴリズムの基礎となっている統計学や数学の知識です。
データ分析に長けた統計学の専門家というよりは、アルゴリズムの開発や実装に長けた研究者であり、プログラマー的な性質が強い傾向にあります。

アルゴリズムや基盤の研究開発ができること

エンジニア系データサイエンティストはアルゴリズムや基盤を利用するだけではなく、研究開発を行って改善できる必要があります。
他の2タイプのデータサイエンティストにとっては、機械学習や最適化のアルゴリズムといったものは道具として利用できれば良い位置づけです。
しかし、エンジニア系データサイエンティストには、この部分の開発・改良が求められます。
前述の尾崎隆氏の記事(こちら)によれば、「少なくとも機械学習・最適化・統計学で研究開発実績を持つ修士・博士でないと難しい」そうです。
情報科学系の研究をしていて、アルゴリズムの開発をしていた研究者の方はこのタイプのデータサイエンティストがハマるかもしれません。

マーケター系データサイエンティスト(Quantitative Analyst: QA)

マーケター系データサイエンティストは、ビジネスの知見に基本的なデータ分析を加えてデータサイエンスを実現する人です。
一言で言えば、データ分析を使ってビジネスを行う者です。
クラシカルなコンサルタントやマーケターといった、市場分析や財務分析に基本的な定量分析を加えて結論を得る人材です。
日本では従来のデータサイエンティストはこの分類になるようです。
そもそも民間企業でデータサイエンスをやる以上、その目的はデータ分析でビジネス課題を解決することです。
他の2タイプのデータサイエンティストにも当然、ビジネス課題を解決する視点が求められますが、このタイプのデータサイエンティストはコンサルタントやマーケターを出自とするデータサイエンティストでビジネスに主軸があると捉えられます。

マーケター系データサイエンティストの能力要件

データ分析とビジネス課題解決を結びつけること

マーケター系データサイエンティストに最も必要なのはビジネス課題とデータ分析を結びつける能力です。
具体的には、データ分析プロジェクトの導入部においては、あるビジネス課題の解決に必要なデータを考案すること、あるいは手元にあるデータから解決できるビジネス課題を設定することが求められます。
逆にデータ分析が完了した後に、どのように業務を改善し収益改善につなげていくかといったデータ分析をビジネスに還元することも求められます。
このようなことを実現するためには、

  • 企業経営、マーケティングなどのビジネス知識
  • 回帰分析などの基本的な統計分析の知識・能力
  • 分析結果をビジネスモデルに反映する能力

が必要です。



データサイエンティスト3類型の違い

データサイエンティスト3類型の違いをまとめて、それぞれの特徴をより浮き彫りにします。
アカデミック系データサイエンティストと他2類型の違いという形でお話します。

アカデミック系データサイエンティストとエンジニア系データサイエンティストとの違い

アカデミック系データサイエンティストとエンジニア系データサイエンティストとの違いは、アカデミック系データサイエンティストがアルゴリズムやコンピュータサイエンスのスペシャリストではないことです。
アカデミック系データサイエンティストもアルゴリズムの開発やプログラミングなどのコンピュータサイエンスは得意としていますし、必要に迫られれば、あるいは興味があればアルゴリズムや分析手法の研究開発を行うこともあります。
一方で、アルゴリズムの開発やプログラミング自体はあくまでもデータ分析に必要な道具であり、それ自体が興味の中心ではありません。

エンジニア系データサイエンティストにとって、興味の中心がアルゴリズムやコンピュータサイエンスで、データ分析はそれをアウトプットする一つの方法です。
これに対し、アカデミック系データサイエンティストにとっては、興味の中心はそのデータの意味するところを理解することであり、アルゴリズムやコンピュータサイエンスはその方法の一つであるという違いがあります。
このような理由で、エンジニア系データサイエンティストにはアルゴリズムや分析基盤の研究開発経験が求められるのに対し、アカデミック系データサイエンティストには本格的なデータ分析の実戦経験が求められます。

アカデミック系データサイエンティストとマーケター系データサイエンティストの違い

アカデミック系データサイエンティストとマーケター系データサイエンティストの違いは、マーケター系データサイエンティストはビジネスを基盤にして分析結果を理解・解釈するのに対し、アカデミック系データサイエンティストはビジネスに関係あるかないかとは無関係にそのデータの本質に迫ることができることです。
民間企業でデータサイエンスをやる以上、アカデミック系データサイエンティストも当然ビジネスの文脈で適切な結論を出すことができますが、仮にビジネスの文脈がなくても分析結果を理解・解釈できるということです。

アカデミック系データサイエンティストに求められるのは、データを分析することで、ビジネスの知見や経験だけからは得られない結論や示唆を与えることです。
GAFAの台頭に見られるように、近年ではビジネスの知見・経験よりもビッグデータの分析によって収益が改善したりビジネスが発展する機会が増えています。
日本企業ではデータ分析に基づく意思決定がまだまだ浸透していませんが、これからはデータ分析を起点にビジネスを発展させることが求められていくはずです。
そのようなときにアカデミック系データサイエンティストの能力が求められるでしょう。



Discussion | 博士・ポスドクが目指すべき類型

博士・ポスドクは、アカデミック系データサイエンティストあるいはエンジニア系データサイエンティストを目指すべきです。
天文学者を含む物理系の研究者はアカデミック系データサイエンティストによくマッチします(というよりも全く同じものと言っても良いかもしれません)。
博士・ポスドクで実験や観測を行っていたのであれば、すでにアカデミック系データサイエンティストとして必要な能力は備えられているはずです。
理論的研究でも、観測結果を説明したり、シミュレーションのデータでも試行錯誤しながら分析を行った経験があればアカデミック系データサイエンティストがマッチするでしょう。

情報工学などのアルゴリズムや基盤の研究開発と直結する研究をしていたのであれば、エンジニア系データサイエンティストがマッチすると考えられます。
情報工学でなくとも、高度なシミュレーションを行うためにアルゴリズムをゴリゴリ開発したり、基盤に手を入れていたという理論研究者ならエンジニア系データサイエンティストでも能力が発揮できそうです。
ただ、私が情報工学出身ではないため、以下はあくまで情報工学以外の博士・ポスドクに向けて書いていきます。

博士・ポスドクの優位性

データサイエンティストとして働くことを考えると、アカデミック出身者には優位性があります。
データサイエンティストとして活躍するためには、どれか1つに軸を起きつつも、3つの分類で求められる能力

  • 統計学・数学 (アカデミック系データサイエンティストの軸)
  • アルゴリズムと基盤 (エンジニア系データサイエンティストの軸)
  • ビジネスの視点 (マーケター系データサイエンティストの軸)

をそこそこ身につけている必要があります。
統計学・数学の知識や理論的背景を学ぶのは時間がかかります。
アカデミック出身者であればすでにこの能力が身についているため、データサイエンティストとして活躍するのに有利です。

アカデミック系データサイエンティストに求められる能力 = 自身の強み

博士・ポスドクの転職活動においては、アカデミック系データサイエンティストに求められる能力をメインの強みとして押し出すのが得策でしょう。
職務経歴書を書きながら、統計学的手法をどのように使ってきたのかをまとめましょう。
研究をしているときには意識して使っていなくても、実は分析手法として名前がついているものもあります。
さらに、アルゴリズムやコンピューターサイエンスの知見があれば、それを補助的な強みとして見せましょう。
特にプログラミングの経験は大きな強みになります。

ビジネス経験の不足は積極的な転職理由として活用しよう

博士・ポスドクにとって、ビジネスの視点が不足しているのは避けられませんが、転職活動ではそれを逆手に取るのも手です。

  • テータサイエンティストとして活躍したいけれども、今はビジネスの経験が足りない
  • アカデミックではその経験は積めないから民間転職が必要になった
  • 特にxxxといったビジネスでデータサイエンティストとして活躍したい
  • xxxといったビジネスの経験を積むには御社の環境が良い

といったストーリーを構成できれば、データサイエンティストとしての強み・弱みから積極的な転職理由を生み出すことができます。



Conclusion | まとめ

最後までご覧いただきありがとうございます!
データサイエンティストの3類型と博士・ポスドクが目指すべき方向性についてお話しました!

データサイエンティストの3類型の能力要件と博士・ポスドクの研究経験と照らし合わせみてください。
自分にとって、どの類型のデータサイエンティストならば、持っている強みが発揮できるかイメージが掴めるはずです!
転職活動中や転職後に、自分の強みを強力にアピールできますので参考にしてみてください。

以上、「転職レシピ|データサイエンティスト3類型(博士・ポスドクの研究経験を活かすアカデミック系データサイエンティスト)」でした!
またお会いしましょう!Ciao!

References | 参考

コメント

タイトルとURLをコピーしました