生成 AI のマルチモーダル技術ー「視覚を持った LLM」ができること
HTML-код
- Опубликовано: 15 янв 2025
- 生成 AI の新技術「マルチモーダル」とは、文章と画像それぞれの意味を LLM が人間並みに深く理解することで、
文章で商品画像を検索したりその逆を可能にします。
人手でたくさんのタグやラベル、説明文を付けずとも、瞬時にデータベース検索が可能です。
このセッションでは、600 万件のメルカリ出品商品を画像検索するデモを紹介し、
生成 AI のマルチモーダル機能がビジネスにもたらす価値を解説します。
スピーカー:
Google Cloud 佐藤 一憲
Google Cloud Next Tokyo ’23 ウェブサイト:
cloudonair.wit...
Google Cloud Japan 公式 RUclips チャンネル:
/ googlecloudjapan
Google Cloud Japan 公式 ツイッター:
/ googlecloud_jp
#GoogleCloudNext