データサイエンティストとは?必要なスキル・将来性をチェック!

データサイエンティストとは?必要なスキル・将来性をチェック!

エンジニアの中にはデータサイエンティストと呼ばれる人がいます。ここ数年で急激に増えてきた職業であり、皆さんも聞いたことがあるでしょう。
ただ、急速にデータサイエンティストが増えてきた割には、具体的な仕事内容を把握できていない人が多いようです。今回はどのような職業であるのか、具体的にご紹介します。

データサイエンティストとは?仕事の概要と業務内容

データサイエンティストとはどのような職業なのでしょうか。仕事の概要や業務内容についてまずはご説明します。

データサイエンティストとは

最初にデータサイエンティストの定義について確認してみましょう。一般社団法人データサイエンティスト協会によると、データサイエンティストとは以下のスキルを持つ人だとされています。

「データサイエンティスト(分析人材)とは、高度に情報化された社会において、日々複雑化及び増大化(ビッグデータ化)するデータを、利用者の利用目的に応じて情報を収集・分析する技術を有し、ビジネスにおいて実行可能な情報を作ることができる者をいう」
https://www.datascientist.or.jp/about/statute/

データサイエンティストの業務内容

データサイエンティストの概要だけでは、なかなか具体的な業務をイメージできないでしょう。そこで具体的な業務内容を例に挙げてみると以下があります。

  • 課題定義
  • データ収集
  • データ分析
  • ソリューション提案

データサイエンティストはこれらの業務だけに対応しているわけではありません。まずは最低限これらの業務について理解を深めていきましょう。

課題定義

最初に「データサイエンティストが解決するべき課題」を定義します。ここで決定された内容をもとに、データサイエンティストは後続の業務をこなしていきます。
基本的に解決すべき課題とは、「データサイエンスの側面から解決したいビジネス上の課題」を指します。ビジネス上の課題には様々なものが考えられますが、その中でもデータサイエンスを活用して解決したいものに対応します。なお、全ての課題をデータサイエンスで解決できるわけではありません。そもそもデータサイエンティストが扱える課題は限られています。
対象となる課題はクライアントなどから提供される場合もあれば、データサイエンティストが一緒に洗い出しをする場合もあります。何が課題であるのか明確でない場合には、そこを明確にする所から対応するのです。
対応する課題が明確になれば、達成目標を定義します。データサイエンティストも闇雲に仕事はできませんので、クライアントと「何をどれぐらいどうしたいのか」を話し合い明確にします。また、達成目標の優先順位をつけたり、仕事のやり方について話し合ったりもします。

データ収集・フォーマット化

課題が明確になれば、それを解決するために必要な情報を収集します。データサイエンティストは多くの情報から課題の解決方法を見つけますので、まずはもとになる情報収集が必要です。
基本的に情報はクライアントから提供してもらいます。クライアントの課題を解決する仕事ですので、現在の状況を把握できるようなものを提出してもらうのです。なお、場合によってはSNSなどの情報を活用します。
ただ、クライアントはどのような情報を提出すれば良いのか分かりません。そのため、データサイエンティストは解決したい課題を踏まえ、クライアントに必要な情報を伝える必要があります。情報を収集するだけではなく、収集する情報を決定する作業からしなければなりません。
加えて対応しなければならないのは、データのフォーマット化です。後続の作業でデータを処理しやすいように、データを所定のフォーマットに当てはめておきます。
この作業はクライアントが担当する場合もデータサイエンティストが担当する場合もあります。クライアントが担当してくれれば作業が減りますが、そうでなければデータサイエンティストが担当するしかありません。

データ分析

必要となるデータの収集が完了すると、データ分析をします。データ分析は「収集したデータから統計学的に意味のある数字を導き出す作業」です。つまり、この分析結果が後続の「ソリューション提案」に大きく影響します。
データ分析をするために、まずは分析手法を決定します。手法は「分析する対象」「得たい情報」「データ分析の難易度」など様々な観点を加味して、データサイエンティストが適切に選択しなければなりません。ここでの選択を間違えてしまうと、後に悪影響を与えてしまいます。
分析手法の例を挙げるとキリがありません。そのため、大雑把な分類でご紹介すると以下のとおりです。

  • 確率の考えを利用したもの
  • 統計の考えを利用したもの
  • データマイニング手法を利用したもの

分析手法が決定すると、続いては分析ツールを選択します。ツールによって得意とする分析手法が異なるなどの特徴があります。例えばデータサイエンティストならば、以下のツールを利用します。

  • R
  • Excel
  • SAS

無償のツールもあれば、有償のツールもあります。また、無償のツールでも法人で利用する場合は有償となることがあります。どれが良いとは一概に言えませんので、場合によっては複数のツールを使い分けます。

ソリューション提案

データ分析が適切に完了すれば、最後にソリューション提案をします。
データサイエンティストは、データ分析によりクライアントの課題を解決するための知見を得られます。これを活用して、具体的なソリューション提案をします。例えば「売り上げが少ない」との課題に対しては以下のような提案が考えられます。

  • 他社より製品の価格が高いため値引きをする
  • 発売日の売り上げが悪いため事前の広報に力を入れる
  • 時間効率が悪いためマニュアルを整備する
  • リピーターが少ないため接客態度を改善する

これらの例から分かるとおり、データ分析では複数の事柄を関連付けられます。そして、関連があると判断された内容をもとにソリューション提案をします。
クライアントからすると「そのような相互関係があったのか」と驚く部分は多いようです。影響がありそうなデータにあたりをつけ、データ分析を実施して、ソリューション提案に繋げます。
なお、データサイエンティストの役割は基本的にソリューション提案までです。実際にどのように行動するかは、提案を踏まえてクライアントが検討します。

データサイエンティストに必要な4個のスキル


データサイエンティストには様々なスキルが求められます。上記のとおりエンジニア以外の仕事も担当しますので、それに沿ったスキルの習得が必要です。今回はデータサイエンティストが、最低限身につけておきたいスキルを説明します。

プログラミングスキル

ある程度のプログラミングスキルが必要です。
データサイエンティストは収集した情報を利用し、データ分析ができなければなりません。このデータ分析をするために、プログラミングが必要となる場合があります。
主要なデータ分析手法は、ある程度完成したプログラムが公開されています。そのため、これらを活用すればデータ分析が可能です。ただ、必ずしもそのプログラムをそのまま使えるわけではなく、自分でカスタマイズしなければならない場合があります。その場合はプログラムが必要ですので、プログラミングスキルも求められます。
一般的なプログラマーのように、高いプログラミングスキルが求められるわけではありません。データ分析に必要な、最低限度のプログラミングスキルが求められます。

データ分析スキル

データ分析に関連するスキルが必要です。データ分析の手法はもちろんのこと、適切な手法を選択するスキルも必要です。
上記でも説明したとおり、データ分析には様々な手法が存在します。それぞれの手法について、データサイエンティストは正しい理解が必要です。正しい理解を持ち使いこなせるスキルがなければ、データサイエンティストのアイデンティティが失われてしまいます。
また、使いこなせるのはもちろんのこと、必要に応じて選択できるスキルも重要です。クライアントの要望などを踏まえ、データサイエンティストは適切な分析手法を選択できなければなりません。分析手法に関するスキルとそれを踏まえた選択スキルが必要です。

データ解析スキル

データサイエンティストはデータ解析スキルが必要です。
データ分析とデータ解析は混合されることが多々あります。ただ、これらは異なったスキルであり、データサイエンティストは両方のスキルが必要です。
データ解析スキルとは、データ分析した結果から意味を見出すスキルです。「その数字が導き出された原因を探し出すスキル」と言い換えても良いでしょう。データ分析と比較すると、より細かくデータの内容を確認しています。
データ解析をすることで、ソリューション提案の概要が掴めます。データ分析の結果からどこに問題があるのかを導き出せますので、それを解決できるような提案をしていくのです。

ビジネスへの活用スキル

データサイエンティストには、分析結果のビジネスへの活用スキルも求められます。
ビジネスへの活用スキルは、上記のデータ解析に関連する部分です。データ分析した結果を、どのようにビジネスに反映していくかを考えなければなりません。
例えば通販サイトの売り上げが下がった場合、データサイエンティストはページの滞在時間など様々な項目に注目します。仮に滞在時間が短いことで売上が低いのであれば、「UIを改善する」「トップページのバナーデザインを変更する」など、滞在時間が長くなるようにビジネスを考慮した提案をしなければなりません。
ここで重要なことは、ビジネスを理解して提案が出来なければならないということです。滞在時間が短い問題に対し「販売する商品数を増やす」など、的外れなソリューション提案をしてはいけません。

データサイエンティストの将来性


データサイエンティストの将来性はどのようなものなのでしょうか。新しい職業ですので、将来性については気になる人が多いでしょう。まだまだ人によって考え方は異なりますが、ここでは筆者の主張をご紹介します。

AIの発展度合いで将来性は左右される

データサイエンティストの将来性は、AIの発達によって左右されると考えます。
皆さんはご理解頂けていると思いますが、データサイエンティストの役割はデータ分析とそれの解析結果によるソリューション提案です。データサイエンティストは、基本的にはこれら両方の業務を担当しています。
ただ、最近はAIを活用したデータ分析も進められています。必要なデータをAIに読み込ませるとデータ分析が完了してしまうのです。もしこの技術がさらに発展すれば、データ分析をするデータサイエンティストは不要となるかもしれません。現在はデータの整理も人間がしていますが、これもAIが対応できるようになると人間は不要になるかもしれません。いくつかの側面で、データサイエンティストの仕事はAIに取って代わられる可能性があります。つまり、将来性は未知の部分があるのです。
しかし、データ分析はAIに取って代わられたとしても、今のところソリューション提案は人間にしかできません。そのため、データサイエンティストが不要になってしまうことは無いと考えられます。

独立した職種となるのかは不透明

データサイエンティストが独立した職種となれるのかは注目しておきたいポイントです。
現在はデータサイエンティストとして、求人が出ていたり専門学校のカリキュラムが組まれていたりします。世界的に見ても独立した職種として考えられています。
ただ、データ分析はシステムエンジニアやコンサルタントの業務でも扱う場合があります。そのため、データ分析を業務の中心とするデータサイエンティストは、これらの職種にまとめられてしまう可能性はあります。
もちろんこれはまだ憶測ではあります。ただ、データサイエンティストなどエンジニア全般は、職種がまとめられたり分解されたりするものです。時代の変化とともに新しい働き方となっている可能性はあります。

まとめ

データサイエンティストの基本的な知識についてご説明しました。主な業務として「データ分析」「ソリューション提案」を担当していると理解してもらえたことでしょう。
データ分析を中心としますので、データサイエンティストにはデータ分析手法の理解が求められます。様々な手法が確立されていますので、それらについて正しい理解が必要です。また、データ分析をするために、適切なツールを使いこなせることも求められます。
現在、データサイエンティストは独立した職種です。ただ、これからは時代の流れとともに変化する可能性があります。他の職種にデータサイエンティストが含まれてしまい、消滅してしまう可能性もあるのです。


登録フォームボタン
登録フォームボタン

SHAREこの記事をシェアする

admin