画像認識、画像生成とは、どのような仕組みですか

2023年12月28日 2023年12月29日

画像認識とは、画像に写っているものを認識する技術です。

パターン認識の一種である画像認識は近年、深層学習によって精度が向上し、様々な分野で導入が進んでいます。

画像認識には大量の画像を処理することが欠かせません。

画像処理には、ほとんどの画像認識の前に実施する「共通の前処理」と、目的や必要に応じて取捨選択して実施するやや高度な「特殊な前処理」があります。

後者では通常、特徴量と呼ばれる、学習対象の特徴を数値化したデータを得て、特徴量に合った学習モデルを選定します。

深層学習では、この学習モデルから作成されるニューラルネットワーク(CNN)使うことで、画像を認識するのです。

一方、画像生成とは、絵画や画像、映像などを生成したり、加工したりする技術です。

画像生成では基本的に、画像認識と同様の原理でニューラルネットワークに乱数ベクトルなどを入力することで画像を生成、加工します。

また、GAN による画像生成では、ジェネレーターが画像を生成し、ディスクリミネーターが画像の真偽を判定するというプロセスを繰り返すことで、生成画像を実画像に近づけるのです。

この記事を書いた人