第1回データサイエンス・カップ 2015 春

機械学習Jリーグの観客動員を予測するコンテストで3位になったので発表会に行ってきた。

datasciencelab.jp

前から機械学習のコンテストには興味があったけどなんとなく敷居が高くて勇気が出なかった。 今回のは学生向けだし手軽にできそうなので、ものは試しと思って参加してみた。

発表会は上位者の発表とか本職の人の講評とかとても参考になった。 1位のid:puyokwにあとでコード見せてもらって、Rも悪くないなと思い直した(自分は懇親会でひたすらPython3推しまくってた)。GBM/xGBM勉強したい。

自分のモデリングの反省としては、生データをもっと綿密に見ていればよかったと思う。 トレーニングデータに無観客試合が混じってたり、今季J1に初昇格したチームがあったことに気づけばもう少し改善できたはず。

許可をもらったのでコードと発表資料は公開しておく。

github.com

数ヶ月後に自分で見なおして「こんときは全然だったな」と思えるようになってたい。