DiaLog of Froakie(ケロマツ)

ケロマツの暇つぶし。

数学専攻の僕が外部院進して機械学習を学ぼうと思った理由

初めに

僕は数学がもともと好きで、大学でも数学を専攻しているが、二回生夏頃から機械学習に興味を持ち始めた。
しかし、家庭的に、実力的にアカデミアで生き抜いていく自信がなかった。
お金を稼げる職業が欲しかった。そんな時に機械学習に出会った。機械学習の裏には様々な数学が広がっている。僕は好きな数学を応用できて、稼げるこの業界で生きることを決めた。

大学院で外部を受験することはもともとは先生に勧められた。自分も、環境を変えて、機械学習に対して、真摯に取り組んでいる人たちの中で自分も成長したいと思ったので、外部受験した。

以降のこの記事では、自分がこれまで活動してきた中で、「データ分析業界でいかにして生き残るか?」について考えていたことをまとめる。
この記事は、自分の学生としての今までのインターンなどの経験に基づいた僕の考えなので、間違えていたら、ご教示いただきたい。

始めに自己紹介をして、そのあと、キャリアについて話そうと思う。

※かなりポジショントークになっていると思うので不快にさせてしまったら、申し訳ない。

目次

  • 君は一体誰だ?
  • データサイエンスについて
  • 数学について
  • 大学院について
  • 人脈について
  • まとめ

君は一体誰だ?

数学を専攻していて、機械学習に興味を持って独学している学生。

これまでの活動

  • 学部二回生夏
    突如、遺伝統計学に関する研究に誘われる。学部二回生夏を研究のための勉強にすべて費やす。
  • 学部二回生12月
    東京にて、研究内容の発表。19歳なの自分だけで、懇親会のお酒、自分のせいで禁止になる。懇親会で、企業からインターンに誘われる。イベント登壇者として、日経新聞載った。
  • 学部二回生1月
    彼女できる(どうでもいい)
  • 学部二回生3月
    インターン(アルバイト形態)始まる。出勤日数少ないながらも続ける
  • 学部三回生10月
    大学院入試に向けて勉強開始(地獄だった)
  • 学部四回生5月
    リモートでの分析のアルバイトを手に入れる。(業務委託)
  • 学部四回生8月
    大学院合格

研究は先生と友達に誘われた。(その友達とはそれ以降一緒に勉強してきた。)
インターンでの研究業務などはあまり語れないが、一つは統計学に関する研究。もう一つはピープルアナリティクスという分野のデータ分析に関する研究。

今後の活動について

来年度から数学専攻から離れて、大学院で機械学習を研究することが決まっている。大学院では、研究や、数学、機械学習などの勉強はもちろんだが、課題解決能力を上げるように努めたい。

また、様々なイベント、勉強会に参加して、人脈を増やす活動も欠かさず行いたい。

できれば博士とりたい。そのあと企業で研究開発職に就きたい。

データサイエンスについて

キャリアを語るうえで、まずは「データサイエンスに必要な力とは?」について、学生の立場から考えた。

ビジネス力

データサイエンスは、データから価値を生み出すお仕事だと考えている。(自分は)
どういったことに価値があるのかは、人(クライアント)によって、当然違ってくる。
クライアントにとっての価値を理解し、問題定義をまずはしなければならない。そのためには、クライアントから与えられた課題を、「潜在的にどこが問題になっているのか?」ということを探っていく必要がある。

ただ、クライアントはデータサイエンスの経験者ではない。(もし、そうなら自分でやってる)

つまり、クライアントの解決したい課題をデータサイエンスで解決できる課題に落とし込む必要がある。ただし、その際、クライアントにとっての価値(ビジネスインパクト)を無視することはできない。

以上のように、クライアント側にとっての価値を理解し、与えられたビジネス課題を潜在的な課題に落とし込んだうえで、データ分析で解決できる課題に落とし込む力である「ビジネス力」がデータサイエンスに必要な力の一つと言える。

ITスキル

具体的に問題定義ができれば、データ分析業務が始まる。

ビッグデータと呼ばれる時代なだけ、扱うデータは大きいものが多い。必ずしも多いわけではないが、人が目で見て計算するとなると、完全に頭が逝かれる。
大量のデータを扱う際、プログラミング力は必要不可欠である。また、データベースの知識なども必要になるはず。少なくともPython,R,SQLは触れた方がよいと思っている。

また、Excelなどの知識も、たぶんあった方がいい。(これはたぶん)

解析能力

これは言わずもがなだと思う。
数学、中でも線形代数微積分、統計学は欠かせないはず。しかし、よくデータ分析に必要な数学として、この三つがあげられるけど、まったくもって足りないと考えてる(個人的見解)。その話は、また後で。

世間ではAIというワードが盛んすぎる。どこでもかんでもディープラーニングが力を発揮しているわけではないと思う。従来の統計学に基づく分析で事足りることもある。

これは特に学生の方に伝えたいのだが、会社では工数をかなり意識する。つまり、作業時間。
自分がインターンをするまでは、「いくら時間をかけてもいいからよい分析を!」と思っていた。もし、同じことを考えている人がいれば、それは学生だけであることを伝えたい。(自分も学生だけど)

抱えている課題や納期によって、工数と分析結果の良しあしはトレードオフになることがある。その場合、適切に工数管理をする必要があり、簡単な分析手法でもいいから工数を減らした方がよい場面なんて腐るほどある、ハズ。

そういった理由も含め、流行りのディープラーニングばかり勉強するのではなく、地に足の着いた従来の分析手法も勉強するべきであると思っている。

数学について

さて、うえでは、データ分析をするために必要な数学として、線形代数微積分、統計学がよく上げられるという話をした。

自分は、これだけでは全然足りていないと考えている。

確率論、関数解析、代数、多様体、(偏)微分方程式離散数学、さまざまな数学が必要だと思っている。それは、分析手法の裏に隠れている「数学的な保証」を理解するためだと考えている。あとは単純に、様々な数学を知っていると分析の幅が広がるし、より厳密な議論ができるはず。

逆に、線形代数微積分、統計学のみしか知らない分析者は、少なくとも解析能力を強みにして、業界で生き残ることはできないと思う。この三つのみで完結する分析手法だけで戦うのは、歩兵が飛車と戦うくらい差がありそう。(例え下手)

僕は、データサイエンスの業界で生き残るための、自分の強みとして、上にあげた三つのスキルのうち、どれか一つでも極めないとだめだと考えている。ただ、ビジネススキルは学生は最も身に着けにくいと思う。ITスキルは、情報学部の学生が強いはず。自分の場合は、数学専攻なので、解析能力を武器に戦いたいと思っている。(というより、そこしかない)

大学院について

大学院に行くべきか、について話そうと思う。

結論は、当然行くべき。

やはり、研究の経験は、課題解決や分析にとても活きると思う。これはph.D,masterを持っいる分析者と持っていない分析者を比べて、そう思った。(ph.Dとか持ってなくてもすごい人は当然いると思うし、自分も出会った。)

絶対にデータサイエンスにかかわる研究(データサイエンス研究科や、情報学研究科)である必要はないと思う。生物関係の研究室にいた人、神経科学の研究をしていた人、経営学部にいた人など、多種多様な分析者がいた。

学部だけでは、勉強で終わってしまう。課題解決能力は、master,ph.Dに比べて、明らかに劣る傾向がある気がする。データ"サイエンス"という名前なだけに、サイエンスができないと生き残れないと聞いた。その通りだなと思った。

人脈について

人脈は学生にとっては死ぬほど大事だと思う。学生のうちから、名刺を作り、様々なイベントに積極的に参加して、人脈を広げるべきだと思う。

自分もそうやって、インターンを獲得した。

そうやって知り合った人に、自分のスキルを保証してもらうのが一番キャリアに繋がると思っている。だれかわからん人を数回面接して合否を渡すより、以前から実力を知っていて、すでに評価が高い学生の方が企業も欲しいはず。

ただ、せっかく知り合えた人に自分のスキルをすぐ証明できないのはとても機会損失。homepage作成したり、githubにコードを上げたり、勉強した内容をpdfにまとめたりして、それがさっと見れるようにしておいた方がいい。

まとめ

以上のようなスキルなどを身に付けていくことが重要だと考えている。
ここまで読んでくれて感謝。

  • 自分が機械学習に興味を持ったのは、
    ①アカデミアで生き残るのをあきらめた。
    応用数学の分野であること
    ③給料がいいこと

  • 外部受験をした理由は
    ①先生に勧められた。
    ②環境を変えたかった。
    ③学部で培った数学能力を武器に機械学習の分野で戦いたかった。

  • 今後のキャリアについて
    ①いつか博士をとりたい。
    ②博士をとった後、企業で研究したい
    ③数学を武器に自分の市場価値を上げたい。

有償インターンがしたい


どうも、ケロマツです。

今日は僕が学部生のうちに、有償のインターン(データ分析)をどうやって、始めることができたのか、というお話です。


今後データ分析で飯を食っていきたい人が、増えた時のためにこの記事に残しておこうかと思った次第です。


目次は以下の通りです。

では、さっそく!!!



インターンにはいくべき??

これは行くべきだと個人的には思っています。 データ分析で生きていきたい人にとって、インターンは貴重な機会です。


なにが、貴重かというと、インターンでは実務を経験できるからです。


現在の大学生がデータ分析を勉強しようと思えば、ありとあらゆる手段があり、例えばkaggleなどであれば、楽しみながら、競いながら、データ分析をすることができます。

本だって、たくさん出ています。


ですが、実務経験だけは!!!
実務経験だけは、企業でのインターン、もしくはアルバイトでしか経験することができません。


今、企業は即戦力を求めています。


実務経験があるか、ないか、という事実はかなり大きな採用のためのファクターになると思います。


さらに、データ分析しかできない人は、競争で負けていくと思います。(個人的見解)


データ分析をする人でも、ビジネス側に立ち、課題を設定し、解けた時のインパクトを考え、分析し、プレゼンする。


そのような力が求められるはずです。(個人的見解)


できれば、このような経験をさせてくれる有償のインターンに行きましょう。 そして、その経験は就職活動、就職後において、大いに役に立つと思います。


学業との折り合い

これは難しい問題です。

インターンに夢中になりすぎて、本来の職務である学業をおろそかにすることがあってはいけないと思います。

(なので、有償インターンであることは大事です。有償でなければ、ほとんどの学生は、インターン以外にアルバイトの時間で、学問に取り組む時間が少なくなるからです。)


ですが、これは本人が、何を人生の主軸にして生きていきたいか?によるのです。


この話はまた今度ということにしますが。。。


とにかく!学業もちゃんとやろうね!ということですね!(笑)

どうやってインターンをゲットする??

※以下の方法が最適解かどうかは分かりません。
※僕の体験に基づいてのお話です。
※ご了承を

まず、様々な企業の方が参加する、データサイエンスのイベントに積極的に参加しましょう。

その際、名刺を作っていってください。


特に学部生の方は、「まだ学生なのに、名刺持ってるの?!」と驚かれやすいです。(笑)

あとは、様々な人と、積極的にはなし、名刺を交換しまくりましょう!!!!(笑)


その際、インターンの話ができそうであれば、すかさず頼んでみましょう。(当たって砕ける方式)


「やってみる?」とゆわれれば勝ちです。
(ただし、インターンの内容をじっくり聞かないと、無償、交通費支給無し、賃金安い、などの悪条件で働くことになります。すぐに「はい!」と言わないように!(笑))


ただし、当然 * インターンを許可してくれるか * 条件がいいか などは、本人の能力に大きく影響してくると思います。

(さすがに、プログラミングやったことない。数学わからない。データ触ったことないという人に有償インターンきていいよってゆってくれる企業はないと思う。。。)

なので、それまでに能力を磨くのが大事です。(自明)


まとめると、

  • 能力磨く(Python,SQL,数学,機械学習,データ分析...)
  • 名刺作る。
  • データ分析のイベント出る
  • 企業の人と知り合い、インターン紹介してもらう。

みたいな流れです。


以上になります!(*´ω`)

誰かの参考になればいいなぁ

ではまた。

ひっそりと始める


始めまして。ケロマツと申します。
(ポケモンガチ勢の人、ごめんなさい。。。)

こっそりとこのブログを始めることにしました。
だれかにこっそりと呼んでもらえたらいいなと思っております。


さてさて、僕が一体何者かとゆうと、 takutori.github.io
こちらをご覧ください。(自己紹介がめんどくさい、なんてことはある。)

簡単にゆえば、数学を専攻していて、専攻替えてまで、今はやりの機械学習を大学院で研究したいぜ、と考えている学生です。



メインのブログでは、機械学習、数学について、Qiitaではエンジニアリングに関することを書いています。

じゃあなんで三つ目のブログを開設したかとゆうと、
特に理由はないんですよねぇ。。。 ただ、だれにもゆえないようなことを書きなぐってストレス発散になったらいいかなと思って始めたものです。(気を悪くするような投稿があったらごめんなさい。)



そんなこんなで、今日初めての記事を書いたのですが、書くことなさ過ぎてそろそろ終わろうかなと。(笑)

最後に最近会った話をして終わろう。
こないだ大学の研究室でバーベキューがあったんですけど、

下っ端なので、肉焼く係してたら、指の毛?の先っちょだけ燃えちゃって、チンアナゴみたいになってた。

f:id:takutoRi:20190912213727j:plain

P.S. 乳首が服に擦れて痛すぎたから、横の女の子に絆創膏もらって乳首に貼ったんだけど、なぜかその女の子に乳首に絆創膏貼ってることばれてた。笑ってくれてたから良き。