「生成AI」の成り立ちと流れの雑なまとめ

「生成AI」という言葉の雑な流れのメモ。話題ごとにまとめているので、時系列は少し前後してます。

2012年、AlexNetで畳み込みニューラルネット(CNN)で画像認識の性能が劇的向上して、ディープラーニング大流行の幕開け

2014年、敵対的生成ネットワーク(GAN)で画像が生成できるようになる。

GANの流行で、それまでの「AI」が分析、認識、識別といった受動的なものだったことと対比して「生成AI」という言葉が使われだす。
画像や音声を生成するAI、「GAN」の特許が急増 | 日経クロステック（xTECH）

2021年 GPTベースのコーディングモデル(CodeX)を使ったGitHub Copilotが出る。

2022年画像生成にトランスフォーマーを取り入れた画像生成モデルが流行る。DALL-E、Midjourney、Stable Diffusionなど。

2022年9月 Midjourneyで生成した画像がコンテスト一位をとって、世間的に生成AIとその脅威が認知されはじめる。
画像生成AI「Midjourney」の絵が米国の美術品評会で1位に優勝者「物議を醸すことは分かっていた」 - ITmedia NEWS

以降、生成AIといえばチャットUIを持ったAIだと認識される。

トランスフォーマーは自然言語処理から生まれたのに画像生成AIが先に一般に使われてChatGPTが少しあとだったのは、指示応答モデルとしてのチューニングが必要だったことと、不適切な生成の調整が細かく必要だったからかな。

そういえば「生成AI」という言葉が生まれたけど、それまでの生成ではないAIを指すレトロニムは生まれていないことにも気づいた。
生成ではないAIを「AI」とは言わなくなってきているから、たぶん、しばらくしたら「生成」はとれて、単にAIと呼ぶことになると思う。