Googleは12月6日(現地時間)、マルチモーダル処理性能を向上させた新AI「Gemini」を発表した。テキストだけでなく、音声や画像、動画、コードなどのさまざまな情報から総合的に判断して答えを下すことが可能になっているのが特徴だが、文字の説明だけではいまいちピンと凄さが分からず、「ふーん」程度に思われるかもしれない。
手書きの絵を見せると「アヒル」と判断してもらえる
https://i.imgur.com/s2ipcqa.jpg
「アヒルはどっちに行くべき?」という質問に対し、アヒルは友達のところに行くべきだと判断
https://i.imgur.com/IQqI7ll.jpg
「どっちのほうの車が速そうか?」という質問で、「空気抵抗が少ない右」と選ぶGemini
https://i.imgur.com/vLKIc5z.jpg
ん?坂道なら重いほうが速いのでは?
左の方が重いとは限らない
【悲報】なんG民、AIより馬鹿だった…
バカ
2色の毛糸で作れるぬいぐるみを提案
https://i.imgur.com/3Rcy6kd.jpg
いくつかの楽器の絵から1980年代のヘアメタルの音楽をイメージさせ、再生させることも
https://i.imgur.com/lPQVueB.jpg
これでヘビメタ一択になるのおかしくね?
アンプに繋がってるのでエレキでロック周辺なら何でも当てはまるだろ
俺が知らないなんかがあんのかな
「動画は何のものまねをしているのか?」に対し、マトリックスで有名な弾よけシーンのマネだと即座に理解
https://i.imgur.com/EtaALq2.jpg
急いでクエリ直したん?
絵から即座に双子座だと判断できる
https://i.imgur.com/byVUA3A.jpg
AIは流石にやめんやろ
AppleもMicrosoftもそうやろw
中身入れ替え
へー
ゴーグル検索のバードまあまあ便利やったから楽しみやわ
グーグルのチャットAI「Bard」、Geminiに進化 「GPT 3.5より優れる」
Googleは6日(米国時間)、マルチモーダルでの高度な推論性能を備えた新たなAIモデル「Gemini」を発表した。あわせて会話型サービスの「Bard」にもGeminiを特別に調整した「Gemini Pro」を導入した。ただし現時点では英語版のみとなる。
互角くらいか?
知識量はAIやろ