y_uti のブログ

統計、機械学習、自然言語処理などに興味を持つエンジニアの技術ブログです

2013-05-11から1日間の記事一覧

Hellinger 距離による記事間の類似度計算

LDA の用途の一つとして、文書間の類似度の計算があります。今回はこれを試してみたいと思います。前回の記事で参考にした Blei 先生の教科書によると、文書間の類似度は Hellinger 距離を使って計算できるようです。以下のようなコードを書いて試してみます…