自然言語を機械で処理し、それらが持つ意味を抽出します。
自然言語処理とは、人間の言語(自然言語)を機械で処理し、それらが持つ意味を抽出する技術です。
自然言語処理では、言葉や文章といった「話し言葉」から、論文のような「書き言葉」までの自然言語を対象とし、それらの言葉が持つ意味を様々な方法で解析します。
自然言語を解析するためには、AIに大量の自然言語のデータを学習させる必要があります。
大量の自然言語のデータから特徴を抽出し、その概念を獲得することで言語を理解できるようになるのです。
形態素解析の上で、文章の構造、意味、文脈を解析します。
自然言語処理は通常、自然言語処理用の辞書である「機械可読目録」と自然言語の使用方法を構造化した「コーパス」を用意の上で、文章をそれぞれの意味を担う「最小の単位(形態素)」に分割します。
それらの形態素を品詞などに振り分けて(形態素解析)、形態素解析で振り分けた単語同士の関連性を解析し、主に分節感の係り受け構造を発見します。
これらの関係性をツリー(図式)化して(構造解析)、「辞書」に基づいて意味を利用して正しい文を解析するのです(意味解析)。
その上で、複数の文章に形態素解析と意味解析を行い、文同士の関係性を解析することで、最終調整します(文脈解析)。