Google Gemini / Bard

今年は、このブログでもいろいろと扱ってきましたがChatGPTに始まり生成AIの話題でもちきりでした。

ChatGPT

プログラムの世界でもVSCodeでコードを自動生成してくれるCursorというものが出現してAIとペアプログラミングができるのではと期待しています。
またGoogleから最近Geminiというテキストだけでなく画像や動画、音声も理解できるAIが発表されました。今回はこれを試してみました。(今のとこと画像しかアップロードできないみたい)

まずGeminiのデモ動画にあるアヒルがどちらに進むべきか、を問う質問をためしてみました。Bardを使うのがはじめてなので、もともとできたものなのか、今回の発表でできるようになったのか、どうかわかりませんが、とりあえず実行してみました。

正しく選択しましたが理由については、微妙です。道を選択するのであればあみだくじはと思いためしてみました。


回答は違いますが、意図は理解してくれているように見えます。最初 “You” ではなく”I” だったところ位置情報からGoogleMapを表示してA地点からB地点をマークして説明しだしたので、Youにしました。
Dを選ぶということは横方向にバイアスがかかるのかと思い、今度は横方向の図に変更しました。


一応正解を出しました。まぐれではないか、ということで “You” の場所を変えて再トライ。


やはり間違えました。
しかしコミュニケーションはとれているように感じました。
最後に3次関数のグラフの識別をしてみました。

二次関数ですね。間違いですが意図は通じています。
これをPythonで書いてもらうと以下になります。

このコードをそのまま実行すると

見事です!

こういう世界がやってくるのか・・と漠然とですが未来を予感できます。
これをあたりまえとして、何をこの上に構築していくのか、を考えていく必要がありそうです。