139_形態素解析や係り受け解析の概念を理解している

解説

形態素解析とは、自然言語処理の手法の一つで、ある文章を形態素(言語で意味を持つ最小単位)に分割する技術のことです。

係り受け解析とは、構文解析ともいわれ、文節間の「修飾する(係る)」「修飾される(受ける)」の関係を調べることです。

例えば「優秀なデータサイエンティスト」という文章があった場合の、形態素解析と係り受け解析の結果を以下表に整理しました。

形態素解析 係り受け解析
優秀、な、データ、サイエンティスト 優秀な→データサイエンティスト

ステップアップ

形態素解析と係り受け解析の両方を組み合わせることで、文章の意味をシステムに理解させることができるようになります。例えば「部屋が蒸し風呂のように暑い」という文章は、形態素解析だと、
・ 部屋、蒸し、風呂、暑い
という単語を抽出するだけで、部屋が暑いのか、風呂が暑いのかよく分かりません。

そこで、係り受け解析を使うことで、
・ 部屋が→蒸し→風呂のように→暑い
と文章のつながりが分かり、部屋が暑いことを理解することができるようになります。

キーワード

  • 形態素解析
  • 係り受け解析

ソースコード

データセット