データサイエンティスト

データサイエンティストの仕事内容は?

データサイエンティストになるには?データサイエンティストとはどんな仕事?


データサイエンティストとは大量のデータを解析して整理するプロフェッショナル

私たちの身の回りでは、クラウドサービスや、センサーネットワーク、S N S、スマホの普及などにより、ありとあらゆる膨大なデジタルデータがあふれています。
今の日本の産業界では、このビッグデーターを活用することで、さまざまなビジネスに大きな変革がもたらされることへの期待が高まっています。

データサイエンティストは、この大量のデータを解析して、ビジネスに生かせる形に整理するプロフェッショナルです。
データサイエンティストの仕事は大きく、4つの段階に分けられます。

1 集めるべきデータを考えて集める
ビジネス上の課題に対して、データ分析で解決できそうな事柄を設定します。
そして「どのようなターゲットのどんなデータを集めるべきか」を考え、業務システムやS N Sなどから、必要なデータを集めたり、集めるためのプログラムを作成したりします。
その集まった膨大データを、まずは分析しやすいフォーマットに変換します。

2 データ分析
次にその膨大なデータを分析し、ビジネス上の課題解決につながる有意な項目を抽出して、特定します。
データ分析にはさまざまな方法があり、この分析こそがデータサイエンティストの腕の見せ所ともいえます。データサイエンティストは、行いたい分析手法に対して適切なツールを使って分析します。

3 課題解決
データを分析して得られたことを、ビジネスでどのように活かし、課題解決に結びつけるのかを考えます。

4 レポートを作成&提案
データ分析から得られたことを説明するために、図形やグラフィックを使って可視化したレポートを作成します。そしてビジネス上の課題解決に向けて、経営層や各事業担当者に向けてビジネス戦略を提案します。
データサイエンティストはどんな働き方をするの?

データサイエンティストは企業の正社員で働く場合が大多数

近年はどの業界でもデジタル化が進んで、自社の顧客データから潜在ニーズを分析して、新サービスの開発や広告に活かすなど、データサイエンティストを積極的に採用したい企業が増えています。

そのためデータサイエンティストの勤務先は、シンクタンクやリサーチ会社、経営コンサルタント企業、I T系企業、銀行証券会社、保険会社など金融系企業、大手総合メーカー、自動車メーカーの他、あらゆる業界に広がっています。

データサイエンティストの場合、企業の正社員で働く場合が大多数です。昨今はデータサイエンティストとして企業で働いたのち、フリーランスで働く人もいます。

データサイエンティストは現在人手不足で、かなり高い需要があるため、給与水準はとても高くなっています。
データサイエンティストはどんな人に向いているの?

データサイエンティストにはプログラミング言語やコーディングに興味がある人に向く

・データサイエンティストに求められる技術的スキルとは?


データサイエンティストに求められる代表的な技術スキルを紹介します。

プログラミングスキル(Python、R言語、Javaなど)
データサイエンティストには、プログラミング言語の知識やコーディングの知識が必要です。データサイエンティストの仕事では、プログラムを書く機会がたくさんあります。
なかでも「Python(パイソン)」は、さまざまなアプリケーション制作とも相性がよく、ニーズの高い言語です。

データベースに関するスキル(Hadoop、Spark、SQLなど)
データサイエンスが使うデータは、基本的にデータベースに格納されています。そのため利用する時にはデータベースに関する知識が必要です。データベースを操作する時に使う言語SQLへの理解、そしてHadoop(ハドゥープ)、Sparkといったデータの「分散処理」システムへの理解が求められます。「分散処理」を簡単にいうと、膨大なデータを1台のコンピュータで処理すると大変な時間とパワーがかかるので、複数のコンピュータに手分けして処理させ、処理を短時間で実行させる仕組みのことです。

データ分析用のソフトウェアに関するスキル(R、SAS、Tableauなど)
データ分析の手法は、途中計算が非常に複雑なため、専門的な分析ツールを使いこなせることが必要です。専門的な分析ツールとしては、オープンソースソフトウェアであるRなどが活用されます。

SAS(エスエーエス/サス)は、データ解析や統計分析、解析結果の可視化などを行えるパッケージソフトの一つです。データベースや表計算ソフトに蓄積されたデータを取り出し、統計的手法をはじめとする、様々な解析手法を用いて分析し、結果を表やグラフなどで表すことができます。

Tableau(タブロー)はタブローソフトウェア社が販売するB I(ビジネスインテリジェンス)に特化した、データの可視化ツールで、データを入れるとグラフィックで視覚的にわかりやすく表示できるソフトです。

データ分析手法に関する知識(統計学、データマイニング、数学など)
データサイエンティストには、データマイニングの知識技術が欠かせません。データマイニングとは、膨大なデータから有益な情報(知識や内包するルールなど)を発掘(マイニング)する技術、手法の”総称”です。またデータ分析の共通語となる数学の知識も必要です。高校で習う「確率統計」、「微分積分」、「行列」の知識を最低限身につけることが必須です。

機械学習に関する知識
A Iの得意とする機械学習の知識は、短時間でより多くのデータ分析が可能になるため、データサイエンティストに必須の知識です。機械学習というのは、コンピュータが大量のデータを学習し、分類や予測の作業をするための手順を、自動で構築する技術です。

・データサイエンティストに必要なその他のスキル


データサイエンティストは、単に膨大なデータを分析するだけに止まらず、ビジネス上の課題を解決するための提案を行います。そのためビジネスとの課題の背景を理解するための知識、データを使った解決法やビジネス戦略をわかりやすく提案するためのコミュニケーションスキルも必要です。
データサイエンティストの将来展望は?

データサイエンティストの将来展望 専門性の高い分析スキルやコミュニケーションスキルが生き残る
データサイエンティストブームの一方で、いずれA Iがデータサイエンティストに取って代わる、とも言われています。
A Iは既存のデータの分類が得意で、それに基づいた未来予測もできるようになっています。そのためデータサイエンティストは、A Iの機械学習に関する知識をもち、A Iの得意な分野はA Iに任せ、A Iが苦手なところを自分が補う、という形で、より高度なスキルを持ったデータサイエンティストになることが必要になります。

また現在日本はデータサイエンティストの育成が急務で、日本国内の大学や専門学校では、データサイエンス学部・学科・研究コースが増えてきました。
オンラインで学ぶ環境も整い始めています。
将来的にはデータサイエンスの知識・技術を持つビジネスマンは、さほど珍しくない状況になることも考えられます。
しばらくはデータサイエンティストの需要の高さは続きそうですが、その先のもっと未来は、専門性の高い分析スキルやコミュニケーションスキルを持ったデータサイエンティストだけが生き残っていく、なども考えられます。

データサイエンティストにはこうすればなれる!

データサイエンティストになるには?役立つ資格は?

・データサイエンティストに新卒からなるルートとは?


データサイエンティストになるには、データサイエンスを学べる学部・学科のある大学・短大・専門学校で学び、卒業後にデータサイエンティスト職種枠で就職するのが早道です。

例えば国公立大では、滋賀大、横浜市立大で「データサイエンス学部」が、私立大では武蔵野大で「データサイエンス学部」が開設されています。
また東京大で「数理・データサイエンス教育プログラム」が開設されています。

米国では、データサイエンス課程のある学部が多くあるため、留学をするのも一つの選択です。

・データサイエンティストに役立つ資格


データサイエンティストになるために必須の資格はありません。しかし役立つ資格を紹介します。これらの資格取得をめざして勉強をすることで、データサイエンティストに必要な知識を体系的に学べます。

基本情報技術者試験
情報処理推進機構(IPA)が実施する、ITに携わる業務に必要な知識スキルを認定する国家資格です。I T系人材に必要な知識、技術、能力があることを評価する試験です。

データベーススペシャリスト試験
情報処理推進機構(IPA)が実施する、データベースの設計や管理までの専門的な知識を問われる試験です。データベースに関する試験の中でも最難関と言われています。

OSS-DB 技術者認定試験
特定非営利活動法人エルピーアイジャパン(LPI-Japan)が、オープンソースデータベース(OSS-DB)に関する技術力と知識を認定する民間のIT技術者認定資格です。データベースの基礎的な知識と技術が問われます。基礎的な「Silver」、より応用的な「Gold」の2つのレベルがあります。

Python試験
一般社団法人Pythonエンジニア育成推進協会が実施している民間資格です。Pythonはデータサイエンティストに必須のプログラミング言語です。基礎を問う「Python 3 エンジニア認定基礎試験」と、Pythonを使ったデータ分析の基礎や方法を問う「Python 3 エンジニア認定データ分析試験」があります。

統計検定
日本統計学会が認定する、統計に関する知識や活用力を評価する全国統一試験です。データサイエンティストに必須な統計の知識を確認できます。習熟度別に5段階のレベルがあります。

G検定・E検定
一般社団法人日本ディープラーニング協会が主催する資格試験。
事業を活用する人材用の「G検定」と、エンジニア向けの「E検定」があります。データサイエンティストの必須知識の機械学習・ディープラーニングの基礎・技能を測る試験です。