「生成AI」の成り立ちと流れの雑なまとめ

「生成AI」という言葉の雑な流れのメモ。話題ごとにまとめているので、時系列は少し前後してます。

2012年、AlexNetで畳み込みニューラルネット(CNN)で画像認識の性能が劇的向上して、ディープラーニング大流行の幕開け

2014年、敵対的生成ネットワーク(GAN)で画像が生成できるようになる。

GANの流行で、それまでの「AI」が分析、認識、識別といった受動的なものだったことと対比して「生成AI」という言葉が使われだす。
画像や音声を生成するAI、「GAN」の特許が急増 | 日経クロステック(xTECH)

画風変換アプリなどでちょっと認知される。
写真を「ゴッホ風に」「ピカソっぽく」AIが自動加工 12種類の画風に対応 - ITmedia NEWS

2017年 自然言語処理トランスフォーマーにより性能向上
Attention Is All You Need - Wikipedia

2021年 GPTベースのコーディングモデル(CodeX)を使ったGitHub Copilotが出る。

2022年 画像生成にトランスフォーマーを取り入れた画像生成モデルが流行る。DALL-E、Midjourney、Stable Diffusionなど。

Stable Diffusionを利用したAIピカソとかもあった。
AIお絵描きアプリ「AIピカソ」をリリース |お知らせ|株式会社AIdeaLab

2022年9月 Midjourneyで生成した画像がコンテスト一位をとって、世間的に生成AIとその脅威が認知されはじめる。
画像生成AI「Midjourney」の絵が米国の美術品評会で1位に 優勝者「物議を醸すことは分かっていた」 - ITmedia NEWS

2022年11月30日 ChatGPT爆誕
ChatGPT が登場 | OpenAI

以降、生成AIといえばチャットUIを持ったAIだと認識される。

トランスフォーマー自然言語処理から生まれたのに画像生成AIが先に一般に使われてChatGPTが少しあとだったのは、指示応答モデルとしてのチューニングが必要だったことと、不適切な生成の調整が細かく必要だったからかな。

そういえば「生成AI」という言葉が生まれたけど、それまでの生成ではないAIを指すレトロニムは生まれていないことにも気づいた。
生成ではないAIを「AI」とは言わなくなってきているから、たぶん、しばらくしたら「生成」はとれて、単にAIと呼ぶことになると思う。