y_uti のブログ

統計、機械学習、自然言語処理などに興味を持つエンジニアの技術ブログです

2012-06-24から1日間の記事一覧

NLTK でランダム文生成

Python の NLTK を使って、ランダム文生成で遊んでみました。学習に使うコーパスが必要なので wikipedia のデータを貰ってきます。「要約」が一番小さそうなので、それにしました。それでも 1.2GB くらいあります。 $ wget http://dumps.wikimedia.org/jawik…