「生成AI」という言葉の雑な流れのメモ。話題ごとにまとめているので、時系列は少し前後してます。
2012年、AlexNetで畳み込みニューラルネット(CNN)で画像認識の性能が劇的向上して、ディープラーニング大流行の幕開け
2014年、敵対的生成ネットワーク(GAN)で画像が生成できるようになる。
GANの流行で、それまでの「AI」が分析、認識、識別といった受動的なものだったことと対比して「生成AI」という言葉が使われだす。
画像や音声を生成するAI、「GAN」の特許が急増 | 日経クロステック(xTECH)
画風変換アプリなどでちょっと認知される。
写真を「ゴッホ風に」「ピカソっぽく」AIが自動加工 12種類の画風に対応 - ITmedia NEWS
2017年 自然言語処理がトランスフォーマーにより性能向上
Attention Is All You Need - Wikipedia
2021年 GPTベースのコーディングモデル(CodeX)を使ったGitHub Copilotが出る。
2022年 画像生成にトランスフォーマーを取り入れた画像生成モデルが流行る。DALL-E、Midjourney、Stable Diffusionなど。
Stable Diffusionを利用したAIピカソとかもあった。
AIお絵描きアプリ「AIピカソ」をリリース |お知らせ|株式会社AIdeaLab
2022年9月 Midjourneyで生成した画像がコンテスト一位をとって、世間的に生成AIとその脅威が認知されはじめる。
画像生成AI「Midjourney」の絵が米国の美術品評会で1位に 優勝者「物議を醸すことは分かっていた」 - ITmedia NEWS
2022年11月30日 ChatGPT爆誕
ChatGPT が登場 | OpenAI
以降、生成AIといえばチャットUIを持ったAIだと認識される。
トランスフォーマーは自然言語処理から生まれたのに画像生成AIが先に一般に使われてChatGPTが少しあとだったのは、指示応答モデルとしてのチューニングが必要だったことと、不適切な生成の調整が細かく必要だったからかな。
そういえば「生成AI」という言葉が生まれたけど、それまでの生成ではないAIを指すレトロニムは生まれていないことにも気づいた。
生成ではないAIを「AI」とは言わなくなってきているから、たぶん、しばらくしたら「生成」はとれて、単にAIと呼ぶことになると思う。
