仕事をしながら Coursera の Kaggle コースを受けてみる ②

はじめに

この記事は、kaggle Advent Calendar 2018 2日目の記事です。

この記事を読んでもスコアは上がりません。
空いていたので無理やりねじ込みました。

Coursera の Kaggle コース Week 2 の感想記事になります。
コース1週目の記事はこちらからどうぞ。

コースを受講しようか考えている方の参考になれば幸いです。

Week 2

2週目は以下の内容になります。

  • EDA
  • Validation
  • Data Leak

Validation に結構期待していたのですが、だいたい知っているようなことでした。

実際のコンペでの EDA を説明してる動画が一番勉強になりました。

Quiz

Data Leak の Quiz が鬼門(奇問?)です。
計算問題がありますがビデオを見返せば問題ありません。

変な問題が1つ混じっているので、気をつくてください。

Programming Assignment

テストデータのみを使ってスコアを 90% 以上取ることが合格基準です。

やり方自体は書いてあるので、Scipy を使ってその通りに実装します。
Sparse matrices の使い方になれている人であれば、そこまで難しくないのかもれしません。

個人的にはコース全て含めてこの課題が一番きつかったです。
Data Leak さっぱりわからん。

Peer-graded Assignment

見つけたリークについて説明する文章(もちろん英語)を 3 ~ 5 文で書いて提出して、他の受講者にレビューしてもらいます。

合計 3 人、それぞれ 0 ~ 4 pt で採点されます。
クリア基準は、3人合計で 3 ptなので簡単です。

レビューしてくれる(する)人はシステム上で自動で割り振られます。

この課題はレビューする人がいなくなるとクリアできないので、期限内にやっておいた方がいいです。

レビューする数には制限がない(=何個でもレビューできる)ので、最悪フォーラムで助けを求めればなんとかなるかもしれません。

感想

1週目に比べて英語がきつくなってきたので、会社の昼休みに予習して、家に帰って再度聞くというやり方で進めました。

リークは自分で見つけられる気がしないので、コンペにでた時は Kernel と Duscussion を漁ることにします。

Kaggle meet up 行きたかった...

参考資料