転職レシピ|データサイエンティストになるために必要な能力と心構え(ビジネスにコミットする科学者になろう)

転職
博士・ポスドクにとっては研究課題がビジネス課題に替わるだけです

Ciao!みなさんこんにちは!このブログでは主に
(1)pythonデータ解析,
(2)DTM音楽作成,
(3)お料理,
(4)博士転職
の4つのトピックについて発信しています。

今回は民間企業のデータサイエンティストになるために必要な能力と心構えについてお話します!
この記事は、天文学のポスドクだった私が民間企業にデータサイエンティストとして転職する際に下調べした内容をまとめて多少加筆したものです。
2018年の転職活動開始当時、転職エージェントから「データサイエンティスト」という職種を進められました。
「データサイエンティスト」という言葉を初めて耳にした私は、自分なりに「データサイエンティスト」について調べて情報をまとめていました。

民間企業への転職を考えている博士・ポスドクの方には、自身の強みを言語化したり、転職までに準備しておくべきことや転職後に得たい経験を整理するために参考にしていただけるでしょう!
また、すでにデータサイエンティストとして活躍している方も気づきが得られるかもしれません。
私自身、当時のメモを読み直してみると新たな発見があります。

Kaiko
Kaiko

この記事は以下のような人におすすめ!

  • データサイエンティストになるにはどんな能力が必要?
  • データサイエンティストになるために必要な心構えは?

Abstract | データサイエンティストはビジネスに貢献する科学者

この記事では、2018年当時、天文学のポスドクだった私が民間企業にデータサイエンティストとして転職する際に調べた内容に加え、3年弱の実務経験を通して学んだ内容を加筆してまとめます。
当時調べた内容は、Cyber Agentの尾崎隆氏がデータサイエンティストについて解説しているスライド「21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る」の要点を私なりに抽出したものです。

データサイエンティストには「アカデミック系、エンジニア系、マーケター系」の3系統がおり、それぞれ統計学、アルゴリズム、ビジネスに特に強みを持っています。
どの系統のデータサイエンティストであっても、活躍するためには数学・統計学の能力、アルゴリズム能力、ビジネス能力の3つの能力すべてが必要です。
データサイエンスの業務はデータ分析を起点としてビジネス課題を解決し価値を生み出すことです。
データ分析からビジネス課題解決までの過程では、必ず3つの能力すべてが必要になります。
データサイエンティストは、データを科学的な手法で分析し結論を出す科学者であると同時に、ビジネス課題を解決できるビジネスパーソンです。



Background | データサイエンティストの3側面

前々回の記事「転職レシピ|データサイエンティスト3類型(博士・ポスドクの研究経験を活かすアカデミック系データサイエンティスト)」や前回の記事「転職レシピ|アカデミック系データサイエンティストの転職先選び(伸ばすのはエンジニア能力?ビジネス能力?)」で解説したとおり、データサイエンティストには、

  1. アカデミック系データサイエンティスト
  2. エンジニア系データサイエンティスト
  3. マーケター系データサイエンティスト

の3種類の人材がおり、それぞれ

  1. アナリシス・レポーティング系の専門家(数学・統計学の能力)
  2. データマイニング系の専門家(アルゴリズム能力)
  3. コンサルティング・マーケティング系の専門家(ビジネス能力) 

です。

この記事では、どれか一つの能力に秀でつつ、すべての能力を備えるデータサイエンティストになるためのキャリア方針、磨くべきスキルについてお話します。
この記事の内容の大部分はCyber Agentの尾崎隆氏のスライド「21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る」に依拠しています。
尾崎隆氏の見解と私の見解をなるべく分けて書いたつもりですが、どちらの見解なのかよくわからない箇所もあるかもしれません。
この記事にまとめた内容以外にも有益な情報があるので、ご興味がある方は尾崎隆氏のスライドもご覧ください!



Data | データサイエンティストに必要な能力

データサイエンティストには3つの能力すべてが必要

どの類型のデータサイエンティストであっても、データサイエンス業務で活躍するためには数学・統計学の能力、アルゴリズム能力、ビジネス能力の3つの能力すべてが必要です。
データサイエンスの業務はデータ分析を起点としてビジネス課題を解決し価値を生み出すことです。
データサイエンスの業務では、以下のようなタスクをこなします。

  1. データ分析で解決できるかつ社会的に価値のあるビジネス課題を定義する
  2. 解決に資するデータやその分析方法を提案する
  3. データを収集、加工して分析できる状態にする(集計とクレンジング)
  4. 適切なアルゴリズムを用いて分析を行う
  5. 結果を統計学的な視点で解釈する
  6. 結果をビジネス視点で解釈する
  7. 結果から得られる示唆をマーケティング方針や経営方針に落とし込む

このような作業を行うために、データ分析(統計学の能力&アルゴリズムの能力)と同時にビジネス課題の解決(ビジネス能力)が求められます。
できればどれか一つの能力に秀でつつ、他の2つの能力もある程度備えていることで、データサイエンス業務で活躍する可能性が高まります。

データサイエンティストは科学者であることが前提

データサイエンティストは科学者であることが前提で、科学的手法でデータを扱いビジネスに貢献できることが求められます。
前述のデータサイエンス業務で行われる7つの作業は科学研究を進めるのと全く同じフレームワークです。
研究課題がビジネス課題に置き換わったにすぎません。
博士・ポスドクにとって、科学的手法でデータを扱い学術研究に貢献してきた経験が強みとなります。
民間企業での就業経験がなくビジネスの知見が少ないことはビハインドですが、学術研究とほとんど同じフレームワークなのでビジネスの経験さえ積めば活躍できる可能性が高いのです。



Method | データサイエンティストになるためのキャリア方針

データサイエンティストになるためには、3類型のための要件のうち予めどれか一つを満たしていることが望ましいです。
そこで、現時点で3類型のどれに近いかに応じてまず目指すべきデータサイエンティスト像が異なります。

科学部門の人はアカデミック系データサイエンティストを目指す

博士・ポスドク(まれに大学教員)などの科学者はすでに定量的研究(Quantitative Research)、データ解析のスペシャリストです。
したがって、アカデミック系データサイエンティストとして活躍できる下地が整っています。
統計学、計算機科学、データマイニング、データ分析などの経験があり、科学的手法をマスター済みの人材のはずです。

博士・ポスドクからデータサイエンティストになるにはビジネス能力を磨く

科学者からアカデミック系データサイエンティストになる場合にはビジネス能力を磨く必要があります。
同時に、大抵の人には企業への就業経験がないことによるハンディキャップがあります。
応募者としてはこのことを自覚しておく必要があります。
採用する側も「企業で働いた経験がないんだよね。最初から高い職位(=高い年収)を与えるのは難しいな」と考えます。
実際、私が転職したときも私を採用した経営者はこのように考えていたそうです。
もっとも、ひとたび活躍してしまえば「博士・ポスドクは民間就業経験がないから活躍できない」なんてことは言われなくなります。
代わりに「この人みたいな博士・ポスドク人材がもっとほしい」と言われるようになります!

アカデミック系データサイエンティストの著名人

この類型の著名なデータサイエンティストとしては、浜田晃一氏(DeNA)、倉橋一成氏(iAnalysis)、尾崎隆氏(CyberAgent)が挙げられます。
ちなみに尾崎氏のスライドには、ご本人の名前を著名人として書かれていませんが、ここでは加えさせていただきました。

私もここに名前を挙げられるようなデータサイエンティストになりたいものですが、上記の面々を見ると事業会社のデータサイエンティストですね。
コンサル系会社のデータサイエンティストをやっていて大丈夫なのだろうかという一抹の不安があります。
ただ、このタイプのデータサイエンティストはそもそも人工が少ないので、上記の面々にも偏りが生じやすいと思われます。
コンサル系会社と事業会社データサイエンス業務の違いや、それぞれのメリット・デメリットについては別途まとめたいと考えています!
ご期待ください。

エンジニア部門の人はエンジニア系データサイエンティストを目指す

エンジニア部門の人はDBエンジニア/データマイニングエンジニアのいずれか通じてエンジニア系データサイエンティストを目指すとスムーズに活躍できそうです。
DBエンジニアやデータマイニングエンジニアとしての能力は、データサイエンティストの要件の一部です。
これらの職に就いてから、エンジニア能力を極めつつ科学的手法を身につければ、エンジニア系データサイエンティストとして活躍できそうです。

エンジニア系データサイエンティストの著名人

この類型の著名なデータサイエンティストとしては、中林紀彦氏(日本IBM)、比戸将平氏(日本IBM→PFI)などが挙げられるそうです。
システムベンダーのエンジニア出身という感じでしょうか。

ビジネス部門の人はマーケター系データサイエンティストを目指す

ビジネス部門の人はマーケッター/アナリスト/コンサルタントを通じてマーケター系データサイエンティストを目指すのが良さそうです。
マーケッター、アナリスト、コンサルタントとしてデータ分析をビジネスにつなげる能力は、データサイエンティストの要件の一部です。
これらの職に就いてから、ビジネス能力を極めつつ科学的手法を身につけることで、マーケター系データサイエンティストとして活躍できそうです。

マーケター系データサイエンティスト の著名人

この類型の著名なデータサイエンティストとしては、工藤卓哉氏(アクセンチュア), 草野隆史氏, 佐藤洋行氏(ブレインパッド), 井澤正志氏(gloops)などが挙げられるそうです。
こちらはコンサル系会社なので、やはりコンサル出身のデータサイエンティストという印象を受けます。



Results | データサイエンティストになるために磨くスキル

私が転職活動当時に参考にしていた、尾崎隆氏のデータサイエンティスト解説スライド「21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る」では、データサイエンティストになるために身につけるべき能力として、

  • データベースの基盤技術
  • データマイニングのアルゴリズム
  • ビジネスの貢献への仕方

の3つが挙げられています。
以下ではこの3つについて簡単にまとめます。

データベースの基盤技術

尾崎隆氏は、データベースの基盤技術は必ず必要になるとおっしゃっています。
ビッグデータを扱う以上、データベース操作はどこかで必要になるため、

  • SQL
  • Hadoop
  • Oracle

などのデータベース操作ができるようになる必要があるということです。

データを引っ張ってきて整形するといった基本的な操作は必要

私の感覚としては、「調べながらSQLを書いてデータベースから所望のデータを引っ張ってくる」ぐらいのことができる必要があると思います。
私の場合、解析はpythonでやってしまうので、SQLで複雑な処理をする必要はありません。
目的のデータが格納されているテーブルから必要なデータを引っ張ってきて、ある程度整形することができれば事足ります。
それでもデータを引っ張ってきて整形するといった基本的な操作ができないと、そもそも分析に必要なデータが作れないのでデータベースの基盤技術は必要です。

データマイニングのアルゴリズム

データマイニングの研究者のように自分でアルゴリズムをすべてコーディングできる必要はありませんが、ツールとライブラリ・パッケージを使いこなして行いたい分析が行えるというレベルは必要です。
また、尾崎隆氏は「個々のアルゴリズムの原理の違いを知識だけでもいいので知っておくべき」とおっしゃっています。

手法の研究よりも意思決定につながるトライアンドエラーを重ねる

こちらについては、私の経験からしてもそのとおりだと思います。
データサイエンスの業務では、何個かの手法で分析してクイックな結果を出してみてから、より深い分析を行うことが良くあります。
というよりもクイックな分析結果で結論が出てしまうことの方が多いかもしれません。

アルゴリズムの原理は理解した上で分析を

アルゴリズムをゴリゴリ書き換えてマニアックな分析を進めるというよりも、使えるライブラリはどんどん使って、結論や分析のアプローチ方法の改善など、意思決定に繋がる結果を出していくことが重要です。
ただし、「ライブラリはどんどん使って」といっても、自分がどんな分析をしているのかは理解していなくてはいけません。
使っているライブラリがどのような原理で何を出力しているのは知っておく必要があります。

ビジネスの貢献への仕方

ビジネスの現場に入ってビジネスへの貢献の仕方を身につける必要があります。
実際のビジネスにコミットしてこそデータサイエンティストです。
実際にKPIなどのデータを計測・集計・分析してみたり、現実のデータに触れ、自分たちのアクションで何が代わり、社会の変化で何が動き、人々の行動どう推移するのかを自分の目で見て経験値として貯める必要があります。

まずはビジネス界のデータと手法を知るところから

博士・ポスドクの場合、データサイエンスの本にななめ読みでもいいので目を通してみて、ビジネスの世界にどのようなデータがあって、どの手法で分析しているのか知るところから初めると良いと思います。
研究で無意識に使っている手法に実は名前がついていて、ビジネスの世界でも使われているということは良くあります。
そのような接点を探れると、ビジネスにコミットするいとぐちを見つけやすいでしょう。



Conclusion | まとめ

最後までご覧いただきありがとうございます!
データサイエンティストになるために必要な能力と心構えについてお話しました!

データサイエンティストは科学的な手法でデータ分析を行う科学者であると同時に、ビジネス課題の解決ができるビジネスパーソンです。
統計学の能力、アルゴリズムの能力、ビジネスの能力のどれか一つに特に秀でつつ、すべての能力をある程度身につけておく必要があります。
幸い博士・ポスドクは最もハードルの高い統計学の能力は研究で身につけており、分析で使うアルゴリズムについても知見があるはずです。
この点でデータサイエンティストとして活躍するためのハードルは低いです。
ビジネスの経験さえ積むことができれば、研究課題がビジネス課題置き換わっただけなので、活躍のチャンスがあります!

以上、「転職レシピ|データサイエンティストになるために必要な能力と心構え(ビジネスにコミットする科学者になろう)」でした!
またお会いしましょう!Ciao!

コメント

タイトルとURLをコピーしました