y_uti のブログ

統計、機械学習、自然言語処理などに興味を持つエンジニアの技術ブログです

2016-08-01から1ヶ月間の記事一覧

『言語処理 100 本ノック』に PHP で挑む (問題 37 ~ 39)

『言語処理 100 本ノック』に PHP で挑戦しています。今回は第 4 章の残りの問題を解きます。 www.cl.ecei.tohoku.ac.jp 37. 頻度上位10語 出現頻度が高い10語とその出現頻度をグラフ(例えば棒グラフなど)で表示せよ.

『言語処理 100 本ノック』に PHP で挑む (問題 31 ~ 36)

『言語処理 100 本ノック』に PHP で挑戦しています。前回は、MeCab を導入して形態素解析の結果を読み込む関数を実装しました。今回は、この関数を利用して問題 31 以降を解いていきます。 www.cl.ecei.tohoku.ac.jp[2016-08-19 追記] 各問題の実行結果を追…

『言語処理 100 本ノック』に PHP で挑む (問題 30)

『言語処理 100 本ノック』に PHP で挑戦しています。前回までで第一章を終えましたが、少し飛ばして今回は第四章を進めます。 www.cl.ecei.tohoku.ac.jp 準備 夏目漱石の小説『吾輩は猫である』の文章(neko.txt)をMeCabを使って形態素解析し,その結果をn…

オフラインリアルタイムどう書く E06 に参加しました

8/6 (土) に開催された「オフラインリアルタイムどう書く E06」というイベントに参加しました。与えられた問題を解くプログラムを 1 時間の制限時間内で実装し、各自が実装したコードを発表するというイベントです。問題と各参加者の実装へのリンク集は、そ…

MeCab の解析結果からラティスを作成する

MeCab の解析結果からラティスを作成するスクリプトを書いてみました。N-best 解を集計して Graphviz の dot ファイルを出力するものです。 github.com以下のように実行すると、MeCab での解析結果が png 形式の画像ファイルとして出力されます。実行には Me…

『言語処理 100 本ノック』に PHP で挑む (問題 06 ~ 09)

『言語処理 100 本ノック』に PHP で挑戦しています。今回は問題 06 から第一章の残りを解いていきます。前回の記事で解いた問題 05 では n-gram という概念が登場しましたが、今回の問題には言語処理特有の話題はなく、いずれも単純なプログラミングの問題…