PAKDD-2015 データマイニングコンペティション(その後)

結局4位で終了。
https://knowledgepit.fedcsis.org/mod/challenge/finalBoard.php?challenge=57

世界各国から腕に覚えのある連中が参加している中で、149エントリー中の4位というのはなかなかい良い結果と言っていいでしょう。3位とは0.00008703差で実質的な差はありません。

PAKDDのオーガナイザからの招待を受けて参加しましたが、そこそこの結果が残せてなんとか面目は立ちました。

知能数理研究室は言語データを機械学習で扱うのを最も得意としているのですが、今回のデータは規模が小さく、また閲覧したURLの集合から性別を判定するという問題であり、言語データとは性質が違っていて、かなり苦労しました。Self-trainingがかなり効いたのが意外でした。