Googleの「Gemini」がChatGPTのGPT-4を超える?! 今後のAIの可能性を拓く最新AI情報

date_range 2024/02/29
GUARDIAN Marketing BLOG
石島 さやか
Geminiについて

GoogleがBardの超進化版Geminiを発表しました。

Googleのありとあらゆる叡智を注ぎ込んだ性能の高さです。

Geminiは現在、「Google Bard」および「Pixel 8」との統合を通して利用可能ですが、

今後Googleの他のサービスにも徐々に組み込まれていく予定です。

さてどんな生成AIなのでしょうか?

Geminiとは?

Geminiは、テキスト、コード、画像、音声など、さまざまなデータを学習する大規模な言語モデルです。

Geminiの最大の特徴は、その生成能力の高さです。


テキスト生成では、自然で人間のような文章を生成することができます。

また、コード生成では、さまざまなプログラミング言語で、複雑なプログラムを生成することができます。


さらに、画像生成では、写真のようなリアルな画像を生成することができます。※画像生成は一部のサービスのみ

Geminiは、今後さまざまな分野で活用されることが期待されています。

例えば、

マーケティング:顧客のニーズに合わせたパーソナライズされたコンテンツを生成

教育:学生の学習内容に合わせて、わかりやすい説明を生成

エンターテインメント:新しいストーリーやゲームを生成

Gemini の3つのモデル


Nanoデバイス上のタスクに最も効率的なモデル(2秒程度で回答してくれる)

Google Pixel 8Proに搭載されている

Pro:幅広いタスクに対応する最良のモデル

無料版Gemini(旧Bard)で利用可能

Ultra:非常に複雑なタスクに対応する、高性能かつ最大のモデル(2024年リリース予定)有料版

さらに、人間の専門家よりも高いレベルとも言われています。


人間の専門家を超えた生成AIはGemini が初めてです。

Geminiはこれだけではなく、マルチモーダルへも対応しています。

マルチモーダルへの対応の高さ


マルチモーダルとは、異なる種類の情報を同時に処理する能力のことです。


今までの生成AI「テキスト」「画像」「動画」「音楽」別々に作られて、最後につなぎ合わせて製品化していました。※ChatGPTは言語モデル

しかし、Geminiは最初からマルチモーダルを基盤として作られています。

これにより、高度な推論をすることができます。


例えば、赤と緑の毛糸をカメラに映し、Geminiに「何か作れませんか」と質問すると、毛糸で作られたりんごの画像を提案してくれます。

また、惑星の絵を3つ横並びにして正しい順序で並び替えて質問すると、正しい答えを教えてくれます。

二つのデザインの車の絵を見せてどっちが早い?に対しても答えてくれます。

(こちらの機能は有料版Ultraになるため、無料版Proでは画像生成は行なっていません)


Geminiの使用方法

Bardに搭載されているため、Bardを使用しながらGeminiを利用できます。

しかし、当面は英語のみで提供予定です。

画像生成などは有料版Ultraからになるため、新しいサービスが始まるのが楽しみです!

今後数カ月以内に利用可能な言語を拡大するとの情報があるので、今後も最新情報を追っていきます!!

まとめ

AI は、賢いソフトウェアというよりも、より便利で直感的な、相談できる専門家または仲間のように感じられるようになるかもしれません。

Geminiをどんどん触って最新を追っていきましょう。

今後も、研究を重ねて皆様に実践的な情報をお届けします。

人物

本記事を読んでいただきありがとうございます!

近年進化し続ける生成AIの今後がとても楽しみになってきました。

それと同時に、AIに負けないためにはAIを活用してさらに上を目指すことが重要となってくると感じました。

今後もChatGPTやBardを活用して、作業効率を上げていけるようにします!!