ChatGPTとGoogle Bard どう使い分ける?自然言語処理専攻の大学院生が解説!

chagpt

ChatGPTについての概要

ChatGPTは、2022年11月に米国のOpenAI社によってリリースされたチャットAIです。
ChatGPTのベースは、GPT(Generative Pre-trained Transformer)と呼ばれるモデル。
これを用いることで、多くの自然言語タスクの性能が大幅に向上します。
利用可能なモデルは、無料版であれば「GPT-3.5」、有料版であれば「GPT-4」です。
ただし、使用には制限があり、3時間につき25メッセージまでとされています。
「ChatGPT」が注目を浴びた理由は、入力文に対して人間のように回答してくれるからです。
このベースモデルは膨大な情報を基に学習されているため、あらゆる質問に瞬時に回答することができます。 

Google Bardについての概要

Bardは、2023年3月にGoogleが公表した新しい対話型AIサービスです。
ChatGPTと同様に、自然な文章で質問をすることができ、正確かつ自然な回答を提供してくれます。
ベースは大規模モデル「PaLM 2」。
2023年2月の発表以来、しばらく進展がなかったBardですが、5月に日本でも利用可能になりました。
BardはGoogleの検索機能を活用し、インターネット上の情報をもとに回答を生成します。
さらに、リアルタイムで情報が更新され、音声入力も可能です。

【無料】2023年9月版生成系AIの業務活用なら!

・生成系AIを活用したPoC開発

・生成系AIの業務活用コンサルティング

・システム間API連携

無料ダウンロード

比較

モデルと学習データについて、それぞれ比較していきます。

モデルの違い

ChatGPTとBardはそれぞれ異なる特性を持つモデルを利用しています。
ChatGPTは、「GPTシリーズ」というベースモデルを使用しています。
このGPTシリーズは、「Transformer」モデルという高精度の機械学習モデルを元に作られた大規模言語モデルです。
GPTは、入力された文の続きを適切に生成する能力を学習しています。
これにより、次の単語の予測や文の生成といったタスクを得意としています。
GPTは、入力文に対して、その文の続きに相応しい文を、確率的に生成するように学習しています。
例えば、「むかしむかし」という入力文に対して、以下の2文のどちらが入力文の適切な続きでしょう?

  • 「あるところに」
  • 「今に至る」

多くの人が「あるところに」を選びますね。
このような判断は、GPTなどのモデルでは次文の生成確率として以下のように表現されます。

  • P(「あるところに」) = 0.8
  • P(「今に至る」) = 0.2

この場合、P(「あるところに」) > P(「今に至る」) となるため、1つ目の文が次の文として生成される確率が高いです。
従って、入力文「むかしむかし」の続きとして、「あるところに」が出力されやすいことを示します。
しかし、これは確率的なプロセスであるため、まれに2つ目の文が選ばれることもあります。
GPTでは、このようなタスクを学習しているので、主に次単語予測や文生成タスクなどを得意とします。

一方、Bardは「PaLM 2」というベースモデルを使用しています.
このPaLM 2は、GPTと同様の学習方法を使用しつつ、数学や多言語に対する学習も行っています。
これにより、Bardは文の生成だけでなく、高度なプログラミングタスクや多言語に対するタスクも得意としています。
なお、GoogleのAI開発では、最初に「LaMDA」というベースモデルが使用されていました。
LaMDAはその自然な会話生成能力から「心を持つAI」とも評されていましたが、現在では「PaLM」を経て「PaLM 2」が主流となっています。
LaMDA開発での蓄積がGoogle にあるので、「PaLM 2」も自然な会話生成能力は引き継いでいるはずです。

学習データの違い

また、ChatGPTとBardは、それぞれ異なる学習データを使用してモデルを訓練しています。
これらの学習データの違いは、各モデルのパフォーマンスや対応能力に影響を及ぼします。
ChatGPTのベースであるGPTは、WikipediaやCommon Crawl(Webサイトから収集されたデータ)などから集めた約45TBのテキストデータを用いて学習しています。
ただし、これらのデータは2021年9月までのものに限定されています。

一方、BardのベースとなるPaLM 2は、ウェブ上の文書やプログラムのコード、会話データなど、より多様なソースから大量のデータを学習しています。
特に、PaLM 2は大規模言語モデルの中でも非英語データの割合が高く、これがBardの多言語対応能力を高めています。
さらに、PaLM 2は学習データに最新情報を含んでおり、それをベースに返答ができます。
それに加え、PaLM 2はへイトスピーチを含む可能性のあるソースのデータを学習に使用しないよう制限しています。
これはAIの倫理的な使用を促進するための重要な措置であり、これによりBardはより安全で信頼性の高い対話を提供できます。

違いから、ChatGPTとBardの使い分けの提案

ChatGPTとBardは各々異なる特性と能力を持つため、どちらを使用するかは具体的な使用目的や状況によります。
以下に、それぞれの特性を考慮した使い分けの提案を行います。

特性選択するべきLLM理由
回答の速さBardBardはパラメータ数が比較的少なく、内部的な処理が速いため
規制の有無ChatGPTChatGPTは規制が比較的緩く、倫理的に反していると判断した質問にも答える可能性があるため
リサーチBard / ChatGPT(有料版)Bardは最新の情報を扱う能力があるため
有料版のChatGPTはプラグインを活用することで最新情報を取得可能。
推論ChatGPTGPTの方が学習データが大きく、言語の細かいニュアンスの理解、より自然な文章の生成が可能なため
文生成の精度
(英語)
ChatGPTChatGPTはパラメータ数も多く、大量の英語データで学習しているため
文生成の精度
(英語以外)
BardBardは多言語のデータで学習しているため
プログラミングの精度Bardプログラムコードに関するテキストを多く学習しているため

【無料】2023年9月版生成系AIの業務活用なら!

・生成系AIを活用したPoC開発

・生成系AIの業務活用コンサルティング

・システム間API連携

無料ダウンロード

まとめ

BardとChatGPTは両方とも文章生成AIであり、
人間のように自然な文章を生成しますが、
それぞれのAIはモデルと学習データの点で異なる特性を持ちます。
その違いと使い分け方法を簡潔に説明します。

モデルの違い

  • ChatGPTはOpenAIが開発し、基本モデルは「GPT-3.5」(無料版)や「GPT-4」(有料版)。
    人間のように回答し、次の単語や文の予測が得意。
  • BardはGoogleが開発、基本モデルは「PaLM 2」。
    多言語や高度なプログラミングタスクに対応可能。

学習データの違い

  • ChatGPTは2021年9月までのWikipediaやCommon Crawl等から集めた約45TBのテキストデータを使用。
  • Bardはウェブ上の文書、プログラムコード、会話データなど多様なソースから学習。
    最新情報にも対応し、非英語データの割合が高い。

使い分け方法

使い分け方法に関して、改めて表を載せていますのでご確認ください。

特性選択するべきLLM理由
回答の速さBardBardはパラメータ数が比較的少なく、内部的な処理が速いため
規制の有無ChatGPTChatGPTは規制が比較的緩く、倫理的に反していると判断した質問にも答える可能性があるため
リサーチBard / ChatGPT(有料版)Bardは最新の情報を扱う能力があるため
有料版のChatGPTは、プラグインを活用することで最新情報を取得可能。
推論ChatGPTGPTの方が学習データが大きく、言語の細かいニュアンスの理解、より自然な文章の生成が可能なため
文生成の精度
(英語)
ChatGPTChatGPTはパラメータ数も多く、大量の英語データで学習しているため
文生成の精度
(英語以外)
BardBardは多言語のデータで学習しているため
プログラミングの精度Bardプログラムコードに関するテキストを多く学習しているため

これらの情報を基に、どちらのAIが自分のニーズに最も適しているか判断いただけると幸いです!

弊社では法人向け生成AI研修・勉強会を行なっています

いかがだったでしょうか?

弊社では、法人様向けに生成AI研修を行なっております。
また、研修に加えて本事業の支援も行わせていただいております。

詳しくはこちらをご覧ください!
セミナー実績 | WEEL

研修をさせていただいた企業様からは、以下のような好評をいただいております。

生成AIについて包括的に理解ができ、多くの業務で生成AIが活用されるようになった。
生成AIの事例を知ることで、社内で生成AIを活用するためのアイデアがたくさん出てくるようになった。
全社で生成AIに関する認識を共有できたので、生成AIに関するプロジェクトの理解が得られるようになった。

研修の内容としては、以下のようなものになっています。

1. 生成AIの概要
2. 生成AIの歴史
3. 生成AIのリスク・対応策
4. 生成AIの活用事例
5. 生成AIの未来予測
6. 〇〇業界特有の生成AI活用法(様々な業界に対応)
7. プロンプトエンジニアリング実践(ChatGPTや画像生成AIへの入力文)
8. AI開発実践(Pythonプログラミング)
9. 生成AIの社内導入手順

※企業様のニーズに合わせて内容はカスタマイズしています。

「社員に生成AIに関する知識を身に付けてもらいたい」
「今後、生成AIを活用して事業展開をしていきたい」

と考えている方は、まずはご相談から承っておりますので、ぜひご連絡ください。

コメント

タイトルとURLをコピーしました