ここ数年、ChatGPTをはじめとするAIが驚くほど賢くなった。まるで突然、人間と同じように考え、話し、文章を書く力を手に入れたかのようである。しかし実際には、「ある日突然」というわけではない。AIがここまで進化したのには、明確な理由がある。鍵を握るのは、三つの技術――Transformer、スケーリング則、そしてRLHFである。
まず最初の要となったのが「Transformer(トランスフォーマー)」である。これは、AIが文章を読むときに、文中の言葉どうしの関係を一度に理解できるようにした仕組みである。たとえば「彼はリンゴをナイフで切った」という文を考えてみる。これまでは「彼→リンゴ→ナイフ→切った」と順番に処理していたため、全体の意味をつかむのに時間がかかっていた。Transformerは、これらの言葉を同時に見渡し、「ナイフで」「切った」「リンゴを」という関係性を一瞬で把握できる。これにより、AIは文脈を理解し、長文でも矛盾なく答えられるようになったのである。
次に重要なのが「スケーリング則」である。これは「AIは大きくすればするほど賢くなる」という経験則である。単純だが強力だ。使うデータを増やし、学習するパラメータ(AIの“脳のシナプス”のようなもの)を増やし、計算力を上げると、精度がどんどん上がる。ある意味では“量が質を生む”世界である。この法則が発見されたことで、世界中の研究者が「では思い切って巨大なAIをつくろう」と動き出した。その結果生まれたのが、GPT-3のような超巨大モデルである。ここでAIは初めて、「少しのヒントを与えるだけで自分で考える」能力を見せ始めた。
そして最後の仕上げが「RLHF(アールエルエイチエフ)」、つまり人間のフィードバックによる学習である。AIが出す答えの中には、正しいけれど冷たいものや、的外れなものも多かった。そこで登場したのが“人間が先生になる”仕組みである。AIが出した答えを人間が評価し、「これが良い答えだよ」と教える。AIはその評価を報酬として学び、人間が喜ぶような返し方を覚えていく。これによって、無機質なAIが、少し人間らしい対話をするようになった。
この三つの技術が組み合わさったことで、AIは“突然”賢くなったように見える。しかしそれは、長年の努力がつながった結果である。機械が文脈を理解し、大量のデータから学び、人間の感覚に合わせて応答する――その全てが揃ったとき、ChatGPTのようなAIが誕生したのである。
いま、AIは文字だけでなく、画像や音声、さらには動画も扱えるようになりつつある。まるで人間の五感を少しずつ手に入れているかのようだ。AIがどこまで“考える存在”になっていくのか、それを見守るのは、私たち人間自身である。AIの進化は、私たちの知恵の延長線上にある鏡なのかもしれない。
