y_uti のブログ

統計、機械学習、自然言語処理などに興味を持つエンジニアの技術ブログです

ロジスティック回帰入門 (社内勉強会発表資料)

勤め先の社内勉強会で、ロジスティック回帰について入門的な説明をしました。発表資料を公開します。できるだけ数式での説明とはせずに、プログラマの立場で、アルゴリズムのイメージを掴めるように説明したつもりです。scikit-learn のロジスティック回帰を使ってみたことはあるものの、ロジスティック回帰がどういうものなのかは学んでいないというプログラマを想定しています。

www.slideshare.net

説明内容に合わせて具体的な実装を確認できるように、Jupyter Notebook で一連の処理を実装しました。こちらは Gist で公開しています*1
https://gist.github.com/y-uti/445cb172ab61d5358864111ee6676e9f

重要かつ基本的なトピックとして、交差検証、過学習正則化といった話題があると思いますが、発表資料には含まれていません。これらは、社内勉強会一回分というボリュームを考えて除外したのですが、勉強会ではそのあたりについて質問、議論があり、やはり入れておく必要があったかなとも思っています。

*1:[2019-03-09 追記] 動作確認環境をコードに追加しました。