y_uti のブログ

統計、機械学習、自然言語処理などに興味を持つエンジニアの技術ブログです

プログラマのための文書推薦入門 (社内勉強会の発表資料)

勤務先の社内勉強会で、機械学習を用いた文書推薦*1に関する基本的なことがらについて説明しました。その資料を公開します。

数学やコンピュータサイエンスを専門的に学んでいないエンジニアでも理解しやすいように、できるだけ数式を使わずに説明したつもりです。厳密性にはこだわっていないので、専門家からはあちこちツッコミを受ける内容かもしれません。

プログラマ向けということで、実際にコンピュータ上で動作を確認できるように、Wikipedia のデータを対象にして類似文書検索を行うスクリプトを作成しました。GitHub に置いてあります。
y-uti/document-recommendation · GitHub

*1:推薦というより情報検索、類似文書検索という方が適切だったかもしれません。