ビジネスの現場で考えるChatGPT4oとo1-previewの使い分け方

2024.10.23 14:34

概要

AI Labメンバーは、Chat GPT4o(以降4o)、o1-preview(以降o1)を駆使しながら業務をしています。

そんなメンバーの声を紹介しながら、それぞれのモデルをどう使いこなすべきなのか、当部から提案をいたします。

 

本文

当部推奨の使いこなし方は、「シーンごとの使い分け」と「使用すべきプロンプト」の2要素で構成されます。

<シーンごとの使い分け>

o1→専門的なコーディング

4o→それ以外の全てのタスク(リサーチ、文章生成、アイデア出し、一般的なコーディング)

 

<使用すべきプロンプト>

o1→あえて工夫を施さない、シンプルなプロンプト(例:下記文章を要約して)

4o→役割を与えるなど、プロンプトに様々な工夫を施す(例:あなたは、プロの編集者です。下記文章を要約して)

その結論に至った、メンバーからの声を紹介していきます。


・1年目エンジニアの声

「自分がやっている業務は一通り両方で行ってみたところ、o1の方が、回答精度はわずかに高いと感じるが、4oでも十分な回答が返ってきており、回答速度、利用制限を考慮すると、4oの方がベターだと感じる。」


・3年目エンジニアの声

「専門的なコーディングは、o1でないと対応不可能。一般的な知識として、ネット上に存在しないようなコーディングも、推論によって実行できる。」


・2年目企画職の声

どんな作業でも、4oで十分と感じた。ただ、目標達成の筋道を細かく提示しているから上手くいくだけで、プロンプトエンジニアリングが困難な人にとっては、o1が有効だと考えられる。また、o1はむしろ、シンプルなプロンプトの方がアウトプットの質が高い。


・大谷(本記事の著者)の所感

「o1の方が、ハルシネーションが少なく、正確に構造化されると感じた。その要因は、物事の意味・関係性を正確に理解できていることにあると推測される。」


私の所感について、実例を交えて詳しくご説明します。

下記のやり取りを見てください。

——————————————————————————————————————————————

——————————————————————————————————————————————

4oでは、AIツールにRPAも含まれており、それは事実とは異なります。

o1では、機械学習、深層学習、自然言語処理と、正しい技術が挙げられています。

もう一つ、興味深い事例を共有します。

 

突然ですが、問題です。

A~Dの中で3人は正直者で、1人が嘘つきです。嘘つきはだれでしょう?

A:Dはうそをついている。

B:僕はうそをついていない。

C:Aはうそをついていない。

D:Bはうそをついている。


答えを出す前に、4oとo1にも聞いてみましょうか。

———————————————————————————————————————————

——————————————————————————————————————————————

答えは、Dですよね。

4oは言葉の意味を理解しておらず、o1は正確に理解できていると言えます。

念のため5回別のチャットで質問しましたが、全て同じ回答でした。


現時点の結論は、実務上で必ずo1を用いた方が良いのは、専門的なコーディングにおいてです。

しかし、より正確なアウトプットが出力されることは示した通りです。

コストや回答速度の変化によって、上位互換になりうるポテンシャルを秘めていますし、

o1でなければならない実務が、これから出てくる可能性も十二分にあります。

都度記事にしていきますので、今後もお楽しみに!

 

執筆、編集作業の所要時間

  • 所要時間: 65分

    • 人間: 60分

    • AI: 5分

内訳

  • メンバーへのインタビュー(by 人間):30分

  • 記事執筆(by 人間): 30分

  • 誤字脱字の確認(by AI): 5分

 

  • 人間のみで記事作成した場合に想定される所要時間: 70分

  • AIによる所要時間削減率:7%

企業担当者の連絡先を閲覧するには
会員登録を行い、ログインしてください。

種類
商品サービス

カテゴリ
広告・宣伝