目次
生成AI(Generative AI)とは
生成AIとは、たくさんのデータを学習し、その知識を使って 新しい文章・画像・音声などを自動で作り出すAI技術 のことです。
既存データを分析するだけではなく、「新しいものを生み出す」点が大きな特徴です。
ボルツマンマシン(1980年代後半)
ボルツマンマシンはニューラルネットワークの一種で、確率的に動くモデルです。
「いくつもの可能性を試して、その中から最も良い答えを選ぶ」という方法で学習します。
ただし、データ量が増えると計算に非常に長い時間がかかるため、実用性の面で課題がありました。
制限付きボルツマンマシン(RBM)
RBMは、ボルツマンマシンの弱点を改善するために作られたモデルです。
- ニューロン同士のつながりを無制限にせず“制限”して効率化
- ネットワークを「入力部」と「推定部」に分けたシンプルな構造
- 教師あり学習と教師なし学習のどちらも可能
これにより、学習が速くなり、より活用しやすくなりました。
生成AIモデルの発展(1990〜2000年代)
自己回帰モデル(Autoregressive Model)
過去のデータを見て、未来を予測するモデルです。
時系列データ(株価・気温など)に特に向いています。
ディープラーニング
脳の仕組みをまねした「多層構造のネットワーク」を使う学習方法で、複雑なパターンを理解できます。
画像・音声・文章など幅広く使われています。
CNN(畳み込みニューラルネットワーク)
CNNは、画像認識に強いAIモデルです。
画像を次のように段階的に理解します。
- 最初の層:線・色などの基本的な特徴
- 中間の層:形の一部(耳・タイヤなど)
- 最後の層:物体そのもの(犬・車など)
「部分 → 全体」へと理解していくため、画像の特徴抽出にとても優れています。
VAE(変分オートエンコーダー)
VAEは、データを一度 ぎゅっと圧縮(エンコード) し、その情報から 新しいデータを作り直す(デコード) モデルです。
特徴は次の通りです。
- 似たデータをなめらかに生成できる
- 異常検知に強い
- データを「潜在空間」という形にまとめられる
GAN(敵対的生成ネットワーク)
GANは、生成AIの歴史を変えた非常に重要な仕組みです。
2つのAIが「対決」しながら進化します。
- 生成器(Generator):本物のようなデータを作る
- 識別器(Discriminator):それが本物かニセモノか見破る
この競争が続くほど生成器がどんどん上手になり、非常にリアルな画像が作れるようになります。
RNN(再帰型ニューラルネットワーク)
RNNは、過去の情報を少し覚えながら新しい情報を処理できるAIモデルです。
時間の流れのあるデータに強いという特徴があります。
例
- 短い文章の理解
- 音声認識
- チャットのような短いやりとり
LSTM(長短期記憶)
LSTMは、RNNの「長い文章が苦手」という問題を改善したモデルです。
- 長い文章のつながりを理解できる
- 遠い場所の情報も覚えていられる
- 長期的な予測にも強い
例
- 長文の意味理解
- 未来の売上などの長期予測