解説
形態素解析とは、自然言語処理の手法の一つで、ある文章を形態素(言語で意味を持つ最小単位)に分割する技術のことです。
係り受け解析とは、構文解析ともいわれ、文節間の「修飾する(係る)」「修飾される(受ける)」の関係を調べることです。
例えば「優秀なデータサイエンティスト」という文章があった場合の、形態素解析と係り受け解析の結果を以下表に整理しました。
形態素解析 | 係り受け解析 |
---|---|
優秀、な、データ、サイエンティスト | 優秀な→データサイエンティスト |
ステップアップ
形態素解析と係り受け解析の両方を組み合わせることで、文章の意味をシステムに理解させることができるようになります。例えば「部屋が蒸し風呂のように暑い」という文章は、形態素解析だと、
・ 部屋、蒸し、風呂、暑い
という単語を抽出するだけで、部屋が暑いのか、風呂が暑いのかよく分かりません。
そこで、係り受け解析を使うことで、
・ 部屋が→蒸し→風呂のように→暑い
と文章のつながりが分かり、部屋が暑いことを理解することができるようになります。
キーワード
- 形態素解析
- 係り受け解析
ソースコード
ー
データセット
ー