y_uti のブログ

統計、機械学習、自然言語処理などに興味を持つエンジニアの技術ブログです

2016-09-01から1ヶ月間の記事一覧

『言語処理 100 本ノック』に PHP で挑む (問題 48 ~ 49)

『言語処理 100 本ノック』に PHP で挑戦しています。今回は問題 48 と問題 49 を解いて第 5 章を終えます。 www.cl.ecei.tohoku.ac.jp 48. 名詞から根へのパスの抽出 文中のすべての名詞を含む文節に対し,その文節から構文木の根に至るパスを抽出せよ.た…

『言語処理 100 本ノック』に PHP で挑む (問題 46 ~ 47)

『言語処理 100 本ノック』に PHP で挑戦しています。今回は問題 46 から進めていきます。 www.cl.ecei.tohoku.ac.jp 46. 動詞の格フレーム情報の抽出 45のプログラムを改変し,述語と格パターンに続けて項(述語に係っている文節そのもの)をタブ区切り形式…

『言語処理 100 本ノック』に PHP で挑む (問題 45)

『言語処理 100 本ノック』に PHP で挑戦しています。今回は問題 45 を解きます。MeCab の解析結果に含まれる「読み」の情報を利用して辞書順に整列する実装も試してみました。 www.cl.ecei.tohoku.ac.jp 45. 動詞の格パターンの抽出 今回用いている文章をコ…

Task Spooler を試した (社内勉強会の発表資料)

先日、Task Spooler というツールを知り*1、少し試してみたところ便利そうだったので、勤め先の社内勉強会で紹介しました。発表資料を公開します。 Task Spooler を試した from y-uti www.slideshare.netTask Spooler は、簡易ジョブ管理システムのようなツ…

『言語処理 100 本ノック』に PHP で挑む (問題 44)

『言語処理 100 本ノック』に PHP で挑戦しています。今回は第 5 章の問題 44 を解きます。 www.cl.ecei.tohoku.ac.jp 44. 係り受け木の可視化 与えられた文の係り受け木を有向グラフとして可視化せよ.可視化には,係り受け木をDOT言語に変換し,Graphvizを…

『言語処理 100 本ノック』に PHP で挑む (問題 40 ~ 43)

『言語処理 100 本ノック』に PHP で挑戦しています。前回は、第 5 章で利用するデータを CaboCha で処理するところまで進めました。今回は第 5 章の問題を解いていきます。 www.cl.ecei.tohoku.ac.jp 40. 係り受け解析結果の読み込み(形態素) 形態素を表…

『言語処理 100 本ノック』に PHP で挑む (第五章の準備)

『言語処理 100 本ノック』に PHP で挑戦しています。今回から第五章に入ります。 www.cl.ecei.tohoku.ac.jp 準備 夏目漱石の小説『吾輩は猫である』の文章(neko.txt)をCaboChaを使って係り受け解析し,その結果をneko.txt.cabochaというファイルに保存せ…

PHP の JIT 実装を試す

PHP の開発者向けメーリングリストに、JIT の開発を始めたという投稿がありました。PHP 8.0 への搭載を目標として開発を進めるそうです。 php.internals: JIT for PHP projectそこで、投稿に書かれているベンチマークテストを私の環境*1でも実行してみました…