ベアの日記

都内で社会学を学ぶ大学院生です。「無限にわーわー喋ってる好青年」

しょぼいポートフォリオ

前回「しょぼいデータサイエンティスト」としてやっていきたいという旨を書きましたが、今回は、「で、お前何できるの?」という点について書いていきます。

 

高度な分析を行う技術はありませんが、地道に記述統計を確認し全体像を把握、仮説を形成して検証する、という訓練を地道に繰り返してきました。社会学では(少なくとも私が訓練を受けてきた範囲では)、高度な分析よりも、変数(とそれが意味する実態)に対する深い理解、分析が意味する社会学の議論に対するインパクトの解釈、といった「分析をどう使うか?それは何を意味しているのか?」といった点に重点を置かれてきました。

 学部の卒論時にこのプロセスをみっちり仕込まれたこと、元々地道な議論が好きな性分も合わさり、ぼくの主にできることは極論地道にデータを確認し、現実の認識に返す、といった作業につきます。

 

以下、これまでの分析経験

詳細なプロダクトが知りたい場合はコメントください。メールアドレスを伝えるのでやりとりしましょう

 

テキスト分析について

 

  • テキストデータに対する分析(文字情報の分析。一般的には「テキストマイニング」と呼称される)であれば、データの作成から分析まで一通り経験があります。
  • ただし、トピックモデル(LDAやLSIなど)など高度な分析は経験がありません。基本的には単純な出現頻度分析と共起分析を組み合わせて、特定の仮説や主題について検討した、という分析が多いです。
  • ただし、その過程でテキスト全体の性質を把握する必要があるため、いくつかの(原始的な手法であるが)テキストデータを概観する作業は分析の度に行っています。
  • 使用経験のあるソフトはKHcoder(無料配布ソフト)、Rmecab ですが可能なら KHcoderが使える環境希望。
  • 分析例 「ライトノベルの説明文からトレンド分析」「朝日新聞社説の分析から戦後の朝日新聞の社説の傾向分析」etc

 

 

一般的な計量分析

 

  • また、社会学で一般的な社会調査データ(語弊を恐れずにいえばアンケート調査)に対する分析経験もあります。
  • 1時点で取得したデータ(cross section data)に限定ですが、記述統計の組み合わせ(2変数の分析)から、重回帰分析、ロジスティック回帰分析等といったポピュラーな多変量回帰分析を行った経験があります。
  • 時系列分析は修士期間に学習予定。
  • 修行中ですが、社会調査データに対するクリーニングもある程度なら経験済み
  • 使用経験のあるソフトはSPSSのみ。
  • テキストデータでない場合は、データ形成から変数設定、仮説形成から要検討です。
  • 分析例 JGSS(日本版総合社会調査)を対象に、サポート・ネットワークに対する無業の効果分析(卒論)。

 

オマケ 

また、文系学問で長くトレーニングを受けてきたため、分析結果を文章にまとめること、人に説明することには一日の長があると思います。

しょぼいデータサイエンティスト概論

今回はしょぼいデータサイエンティストのお話

 

前回、自己紹介がてら「しょぼいデータサイエンティスト」としてやっていきたいということを書いた。

発想の経緯としては、最近遊びにいっているイベントバーエデン@eventbar_eden を経営している、えらいてんちょうさん@eraitenchoが提唱している「しょぼい起業」を受け、それなら「しょぼいデータサイエンティスト」も可能ではないか、と天啓を受けたところから始まっている。

 

まず「しょぼい起業」とは、初期投資をせいぜい50万ほどの、小さい規模で事業を行っていこうというものと理解している(詳しくはえらてんさんのツイッターや記事参照のこと)。個人的に魅力的なアイディアに移ったのは、大規模なビジネスとして展開せずとも、資本を投下せずとも、人の役に立ってさえいれば仕事になるはずだ、という起業理念だ。

 

ところで、大学で社会学を学び、実証の方法として計量データ分析を選び、分析の経験を経るにつれて、「これもしかしたら仕事になるんじゃねぇ??」という思いが長くあった。あるゼミ課題で、最初は全く興味のないテキスト分析を始めてから2週間のめり込み、全テキストを分析し終えたとき、「これでお金を稼ぎたい、誰かに技術として提供したい」という思いだった。せっかく得意な技術があるのだ、活かさない手はない。

ただし、データサイエンスの業界を調べるうち、中々そう簡単な問題ではないことに気づいた。というのも、現状データサイエンス業界は理学、工学系出身の人が多く、方法論としても機械学習やDeeplearning、それでなくともあくまで社会学プロパーでしかない自分からみれば高度な分析が並ぶ。少なくとも統計技術の点からは太刀打ちできない。

 

また、自分のキャリアとしても、あくまで本業は研究者見習いで、どこかの企業に属したいわけでは全くない。

あくまで副業として、データの分析を仕事として請け負いたい、という気持ちが強い。

さらに言えば、大きなビジネスの範囲でなくとも、小さい範囲で緩くデータ分析を使ってほしい、そこでぼくの能力を使ってほしい、というように考えている。

 

そこで「しょぼいデータサイエンティスト」である。

ここで「しょぼい」とは、まず統計技術は単純なデータ集計からポピュラーな多変量解析までという意味での「しょぼい」

大規模なマーケティングや大企業の経営の意思決定なくても、小規模なサイズ感でデータ分析(分析者としてぼくを)を使ってほしいという「しょぼい」の二つの意味を込めている。

つまり、高度な分析手法を扱うことはできない代わりに、比較的安価・短期間でデータの作成から分析を請け負う、「しょぼいデータ分析」はできないか?というアイディアである。

 

じゃあその小規模のデータ分析って具体的にどういう事例なんだよ?とか、

どうビジネスに活かすんだよ?

といった点は全然詰められていないのだが、とりあえず現時点で考えていることはこんな感じ。

 

やっていきたい

 

 PS 大学をでたことないので、「しょぼいデータ分析」のプラン(⚪︎⚪︎してほしい!こんなこと出来る?)は絶賛募集中です。

 

 

自己紹介

最近いろんな界隈(主にイベントバーエデンさん関係)に顔を出していたり、4月からどうあれ人間関係が変わっていくと思うので、自己紹介を。
どうも、ベアと申します、都内の大学で院生20中盤の青年的な生命体です。

先日人に「無限にワーワーしゃべってる人類」「なんか好青年」と評されました。

今後は「無限にワーワーしゃべってる好青年」で売っていこうと思います。


さて今回は、今ぼくが欲しいもの、やりたいことが何か?欲しいものが何か?を中心にその方が分かりやすいと思うので。これは大きく分けて二つあります。


一つ目は、友達が欲しい!!!!

です。
少しだけ説明すると、ぼくは大学をに2留しており、かつこれから大学院へ進学する予定です。大学を留年するとどうなるか。大学を4年で卒業し就職した場合、まず職場において、職場の関係性を通じて(職場の友人の紹介)人間関係が広がりうることが予想できます。もちろん職場の人間関係いやだ、嫌いすぎるということもありえますが、おおむね可能性はあるわけです。
ですが、大学を留年した上で大学院に進学するというライフコースでは、まず留年している間は下級生としか関係が広がらない(後輩たちとも大分仲良くなりましたが、そろそろ新入生が4~5歳下になってきてキツくなってきた)、大学院に進学しても、文系の大学院(特に自分の通う大学)では進学者の数はあまり多いとは言えない、そもそも研究仲間という、やや特殊な関係性(詳しくは書きませんが、色々と都合があります)を帯びてきます。
そんなわけで、フランクかつ曖昧に同年代前後で、できればカルチャーの似通った友人関係が欲しい。できればなにかしらはぐれ者マインドがあれば最高、お酒が好き、美味しい食べ物が好きな人なら文句なし、というわけです。


もう一つは、しょぼいデータサイエンティストになりたい!

です

ぼくは社会学、特に統計データの分析を主軸とする界隈に勉強&研究をしています。将来は研究者として研究を生業にしたいと今のところ考えています。
ただし、順当に業績を上げていっても、社会学分野で「食っていく」のは実際難しいと予想しています。そもそも狭き門というのもありますが、今後(是非はともかく)大学の文系ポストは減るでしょうし、そもそも研究業績をあげ、博士号をとった段階で運よくアカデミックポストが空いていなければ、どうあがいても就職できません。霞を食べていくのも手ではありますが、やはり可能ならば自分の技能でご飯食べていきたい。
そこで、今はやりのデータサイエンティスト(とはいえ、機械学習ディープラーニングも習得していませんが)を、社会学のストックを活かしながら、副業として「しょぼく」やっていけないかと最近考え始めています。
軽く、といいつう長くなりましたが、今後はこんな感じでやっていきたいなぁ、そう思っている次第でございます。