Google Cloud Next 24 参加レポート

2024.09.25 11:25

こんにちは、U-NEXT HOLDINGS社内生成AIアプリケーション”Buddy”開発チームの高見(関西出身)です。8/1、 8/2 に開催された Google Cloud Next 24 へチームメンバーで参加してきました。Google Cloud Next 24 では Google Cloud の最新リリースや利用についての事例をセッションとして聞くことができました。

本稿では以下 2 点をご紹介します。

  • 初学者向け「 Google Cloud 生成AIで利用可能なツールの概要」

  • Google Cloud Next の簡易イベントレポート(生成 AI 関連の最新情報のアップデートをご紹介) 

     

その前に、私たちについて(Development部)

U-NEXT HOLDINGS の AI 業務改革支援部では、ミッションとして「生成 AI を用いた業務効率や生産性の効率の向上」を掲げ、業務アプリケーションの開発、デジタルトランスフォーメーション( DX )を推進してます。現在は Azure 上の生成 AI モデルを利用し、社内専用の Web サービス「 Buddy 」の開発を行っています。チームの歴史がまだ浅いため、改善点は多いながらも、スタートアップのようにスピード重視でチャレンジングな環境が整備されています。(一緒にチャレンジしたくなりましたか?)

他方、私たちのグループでは、 Google Workspace の製品を利用する機会も多く、 Google Cloud の検証(その他サービス含め)、Dify などの生成 AI サービスの検証を積極的に行っています。

 

Google Cloud の生成AIリソース及びツールのご紹介

Google Cloud の生成 AI リソースである Vertex AI を簡単に紹介します。Google Cloudがわからない人もぜひご覧ください。できるだけわかりやすく記載します。

VertexAIについて

Vertex AI は Google Cloud のリソースの一つであり、AI・機械学習に関連するリソースは Vertex AI に統合されています。元々は機械学習のライフサイクル(モデルを本番稼働するまでの流れ)を支援するサービスとして作られたものでした。(図 1 )

従来、機械学習モデルを自動で管理するのは難しく「精度が落ちる」、「計算資源の不足」など、サービスに適応するには様々な課題がありました。これらの課題に対して、簡易に機械学習モデルを管理できるサービスとして Vertex AI(当時は AI Platform )が誕生しました。

現在では、 Vertex AI は機械学習モデルの管理に止まらず、生成 AI の管理もしてくれるように進化し、生成 AI の管理は LLMOps と呼ばれています。

VertexAI の生成 AI サービスは大きく分けると3つのサービスで構築されています(図 2 )。各サービスは大規模言語モデル( LLM )を利用するハードルを大きく下げてくれます。

  • Agent Builder
       ローコードでエージェントを構築できるサービス

  • Model Builder :
       LLM モデルの管理、チューニングができるサービス

  • Model Garden :
       150 種類以上から選択し、大規模言語モデル( LLM )を利用できるサービス

 

ここからは Vertex AI の3つの生成 AI サービスの特徴を紹介します。

Agent Builder

RAG を搭載したAI エージェントをローコードで構築することができます。 特別な知識を必要とせず構築できることから、利用者に優しいサービスとなっています。また、すでに利用している Google Drive などをデータソースとして適応できるため、資料の移動は発生しないことも利点といえます。(図 3 )

Google Cloud Nextでは、動画で見た服購入するデモが公開されており、簡単な利用(ユースケース)の流れをご紹介します。

デモの手順 (ユースケース)

  1. ユーザーがエージェントに対して、「この動画の男性が着てる服がほしいです。{動画のURL}」と指示する。

  2. エージェントは「ECサイトの探索(グラウンディング)」「商品データベースの探索」を行い、目的の商品をユーザーに回答する。

  3. ユーザーに新たな商品検索のUX(ユーザーの体験)を提供する。

Model Builder

大規模言語モデル(LLM)のカスタマイズ機能を提供し、モデル・プロンプトを管理することができます。

大規模言語モデル(LLM)でも依然として「精度」への課題が存在します。一例として、大規模言語モデル(LLM)は自分の知らないことでも、それっぽいことを答えてしまいます(ハルシネーション)。これらを制御し、ユーザに適切な回答をしなければなりません。

モデルの管理する様々な機能が実装されており、今回は基本的な2つの機能を紹介します。

 

  • ファインチューニング

モデルに追加の学習をさせることをファインチューニングと言います。

大規模言語モデル( LLM )は事前に大規模なデータセットを学習しています。しかし、事前学習用のデータには「公開されていない社内データやサービスに関するデータ」は当然含まれておらず、大規模言語モデル( LLM )はそのことについて回答することはできません。これでは、サービスを展開するうえでの必要な回答をできず価値がありません。

これらの課題を解決するためにファインチューニングという手法で大規模言語モデル( LLM )に独自のデータ追加で学習させ、回答を得られるようにします。

  • Reinforcement learning from human feedback (RLHF)

モデルに回答の方針(良し悪し)を教える機能として Reinforcement learning from human feedback ( RLHF ) が提供されています。

大規模言語モデル( LLM )の回答が少し意図と異なったり、好みではないと感じたことはありませんか?サービスに大規模言語モデル( LLM )適応するうえではユーザーの UX(ユーザーの体験)を悪化させることになります。これらを防ぐために事前に回答の良し悪しを人間側で教え込みます。
応答のペア(質問と回答)を作り、どんな回答がよいのかを人間が評価します。その評価をモデルに教え、モデルは人間の評価をもとに回答が良いものであるか理解をしながら回答を改善していきます。これにより質の良い回答を得られるようにできます。また、人間の評価が多いほどモデルの回答が改善されやすくなります。

わかりやすく言い換えると、新人社員に対して「こうやって資料を作るほうがいいよね」などの評価・フィードバックを返し、新人社員が少しずつ良い資料を作れるようになる、そのようなイメージです。

以下に論文の URL も載せているので、ぜひご確認ください。

Model Garden

Google が作ったの生成 AI モデルだけではなく、オープンソースモデルも含めた 150 種類以上のモデルが利用可能です。言語モデルだけではなく、画像・動画に対応したモデルも備わっており、ユースケースに合わせてモデルを選択できます。これらのモデルは自社の Google Cloud 環境内に閉じており、追加でデータを読み込ませた場合でも安心に利用できるのが最大の魅力です。

Google Cloud Next 生成AI関連最新アップデート

ここからは Google Cloud Next で発表された、生成 AI 関連の最新アップデートをご紹介します。(※生成 AI に限ったアップデートになります。)ここもできるだけ優しく楽しく面白くを心がけて説明します。

Geminiの精度が1位に

Gemini とは Google が開発した、大規模言語モデル( LLM )です。非常に高度なアルゴリズムが適用されております。 Google の説明文をご紹介します。(アルゴリズムについても今後本サイトで紹介したいと考えております)

Google の説明引用

Gemini 1.5 は、Transformer および MoE アーキテクチャに関する Google の最先端の研究に基づいて構築されています。従来の Transformer は 1 つの大きなニューラル ネットワークとして機能しますが、MoE モデルはより小さな「エキスパート」ニューラル ネットワークに分割されます。

このような高度なアーキテクチャにより、モデルの精度が急速に向上しています。最近では LMSys Chatbot Arena Leaderboard にて、 Gemini1.5 が 1 位を取得しました。

ML Processing in Japan

Gemini に関する処理が日本リージョンのみで完結します。

企業によっては「日本以外にデータを出すことはダメ」のようなセキュリティ要件が存在します。本リリースにより、 Gemini を企業やサービスでより適応しやすくなりました。

GeminiのSLA対応化

Geminiにサービス稼働の保障がされました。SLA(サービスレベルアグリーメント)は、サービス提供者と利用者の間で交わされる契約の一部で、提供されるサービスの品質やパフォーマンスを明確に定めたものです。

サービスに適応する上で品質(稼働率など)は懸念すべき指標の一つです。このような保障がないと、利用者側として要件を満たさない場合が存在します。このように Gemini の利用者に対して品質保障をかけることで、安心してGeminiを利用できるようになりました。

Gemini 1.5 キャッシング機能

Gemini1.5 で読み込んだデータをキャッシングできるようになりました。マルチモーダル(複数のデータ形式)な処理を行うと、大規模言語モデル(LLM)は巨大な読み込みを実行します。これにより、レイテンシ(データ転送時間)が大きくなる。また、大きなデータ容量の処理が発生し利用金額が高くなります。本機能では回答にかかわる利用率の高いデータをキャッシングし、レイテンシ(データ転送時間)や利用金額コストを改善できます。

Google Vids

Google Vidsは、テキスト指示でプレゼン動画を作成する動画生成AIです。ネット上の動画や画像、BGMを組み合わせ、ナレーション音声も生成します。新製品のPR動画や研修動画など、ビジネス向けに利用されます。

Google Vidsまだクローズドのサービスになっており、一般公開の時期は未定となっています。続報があり次第、弊社でも取り扱いたいと期待しています。

まとめ

Vertex AI の3つの主要サービス:

  • Agent Builder:ローコードでエージェントを構築する機能

  • Model Builder:LLM モデルの管理・チューニング機能

  • Model Garden:150 種類以上の 大規模言語モデル( LLM ) を利用できる機能

また、Google Cloud Next で発表された 生成 AI 関連の最新情報として以下をご紹介しました。

  • Gemini:Google が開発した大規模言語モデル( LLM )。最近、Gemini 1.5 が LMSys Chatbot Arena Leaderboard で1位を獲得しました。

  • Gemini モデルバージョンアップ

    • Pro:処理量が増加し、精度が向上。マルチモーダルデータ形式対応。

    • Flash:回答速度が速く、精度が向上。

  • ML Processing in Japan:Gemini の処理が日本リージョン内で完結するように。

  • GeminiのSLA対応化:サービス稼働の保障が提供され、企業利用が安心に。

  • Gemini 1.5 キャッシング機能:データキャッシングにより、レイテンシやコストを改善。

今後も様々な生成 AI の技術に関して、参加するイベントのレポート等も交えながら、最新の情報をご紹介していきます。お楽しみに!

 

 

企業担当者の連絡先を閲覧するには
会員登録を行い、ログインしてください。

種類
イベント

カテゴリ
広告・宣伝