生成AIの概略とトレンド
生成AI戦争
~さまざまな生成AIの登場と競争~<前半>
約1年前の記事で、ChatGPTとAI戦争の始まり、をお伝えしました。当時、突如出現し、急速に広まり始めた生成AIは、今や企業の一般業務にまで浸透し始めています。さらに、現在ではOpenAI社のChatGPT以外にもさまざまな企業が生成AIサービスをリリースし始めています。
当記事では、生成AI戦争ともいうべき、各種生成AIサービスによる競争の状況や、企業の取り組み事例などについて解説します。
生成AIのおさらい
生成系AI(ジェネレーティブAI)は、機械学習のモデルの一つで、学習済みのデータを活用して新たなデータを生み出せるAIです。テキスト、画像、音声、動画など生成できるものは多岐にわたり、専門知識がなくても利用できることから注目を集めました。
生成系AIは、文章生成、議事録サマリ、画像・動画生成、顧客対応、アイデア創出など、広範な分野で活用されており、現在も範囲は拡大中です。
一方で、生成系AIの利用には倫理的な課題も伴います。今後は、生成系AIの利用には慎重さと倫理的な配慮も求められます。
生成系AIの種類
生成系AIはさまざまな種類が存在します。ここでは、主な生成系AIの種類について見ていきましょう。
テキスト生成系AI
ChatGPTやGoogle社のGemini、Microsoft社のBing AIなどのテキスト生成系AIは、「プロンプト」と呼ばれる指示文章を入力することでテキストが生成され回答されます。人間同士が会話をするように調べものをすることも可能です。
画像生成系AI
画像生成系AIで有名なStable DiffusionやDALL・E2などは、テキストから連想される画像を生成します。人物画・風景画・抽象画などのさまざまな画像の生成に対応しており、この分野は今後さらに広がりを見せることが想定されます。
音声生成系AI
音声生成系AIもテキスト生成AI、画像生成AIと並んで利用されることが多い生成系AIです。テキスト入力したものをAIが学習した音声で読み上げることができるため、特定の人物の音声を学習することで、まるで本人が話しているかのように再現することも可能です。フェイクニュースなどで使われる技術です。
3Dモデル生成系AI
3Dモデル生成系AIも画像生成系AIと同様に、テキストから連想される3Dモデルを生成するAIです。Google社のDreamFusionや前述のStable Diffusionを応用したStable-Dreamfusion、OpenAI社のSoraなどがあります。これらは、今後進化・活用が進むと考えられている分野です。
動画生成系AI
動画生成系AIも同様に、テキスト入力から生成するAIです。動画生成系AIは技術的な難易度が高いとされており、これからの分野です。現在ではRunway社のGen-2がクオリティの高い動画を生成できることで有名です。
米国での生成AIの状況
生成AIの開発や運用には大量のデータ処理能力を持つクラウドサービスの利用が不可欠となり、OpenAI社と組むマイクロソフト、Googleなどは世界のクラウド市場で大きなシェアを持っている企業です。そのため、今のところ生成AIの主戦場は米国となっています。
そして、マイクロソフトはOpenAIのChatGPTを取り込んだCopilot、Googleは自社の生成系AIであるGeminiをGoogleアプリケーションに搭載したビジネスを展開しようとしています。
以下にこの2製品について簡単に説明します。
Microsoft Copilot
製品名はCopilot for Microsoft 365で、Microsoft 365 アプリケーション(Word、Excel、Outlook、Teams など)に統合された AIアシスタントです。 OpenAIのGPT モデルを基に、文書作成、データ分析、メール管理、会議の要約などのタスクを自動化し、生産性を向上させます。リアルタイムの提案や複雑な作業を簡素化することで、業務の効率化を支援します。
Duet AI
Duet AIは、Google WorkspaceとGoogle Cloud向けの AIアシスタントです。Googleドキュメント、スプレッドシート、Gmail、Google Meet などでの文書作成、データ分析、メール管理、会議の要約などの支援をします。また、開発者向けにはコード補完やバグ修正提案を行いユーザーのサポートをします。
今回は、生成AIの概略とトレンドや、生成系AIの種類、米国発の具体的な製品などについて解説しました。次回は、生成AI戦争の国内状況と将来展望について解説します。