ビジネスの現場で考えるChatGPT4oとo1-previewの使い分け方
概要
AI Labメンバーは、Chat GPT4o(以降4o)、o1-preview(以降o1)を駆使しながら業務をしています。
そんなメンバーの声を紹介しながら、それぞれのモデルをどう使いこなすべきなのか、当部から提案をいたします。
本文
当部推奨の使いこなし方は、「シーンごとの使い分け」と「使用すべきプロンプト」の2要素で構成されます。
<シーンごとの使い分け>
o1→専門的なコーディング
4o→それ以外の全てのタスク(リサーチ、文章生成、アイデア出し、一般的なコーディング)
<使用すべきプロンプト>
o1→あえて工夫を施さない、シンプルなプロンプト(例:下記文章を要約して)
4o→役割を与えるなど、プロンプトに様々な工夫を施す(例:あなたは、プロの編集者です。下記文章を要約して)
その結論に至った、メンバーからの声を紹介していきます。
・1年目エンジニアの声
「自分がやっている業務は一通り両方で行ってみたところ、o1の方が、回答精度はわずかに高いと感じるが、4oでも十分な回答が返ってきており、回答速度、利用制限を考慮すると、4oの方がベターだと感じる。」
・3年目エンジニアの声
「専門的なコーディングは、o1でないと対応不可能。一般的な知識として、ネット上に存在しないようなコーディングも、推論によって実行できる。」
・2年目企画職の声
どんな作業でも、4oで十分と感じた。ただ、目標達成の筋道を細かく提示しているから上手くいくだけで、プロンプトエンジニアリングが困難な人にとっては、o1が有効だと考えられる。また、o1はむしろ、シンプルなプロンプトの方がアウトプットの質が高い。
・大谷(本記事の著者)の所感
「o1の方が、ハルシネーションが少なく、正確に構造化されると感じた。その要因は、物事の意味・関係性を正確に理解できていることにあると推測される。」
私の所感について、実例を交えて詳しくご説明します。
下記のやり取りを見てください。
——————————————————————————————————————————————
——————————————————————————————————————————————
4oでは、AIツールにRPAも含まれており、それは事実とは異なります。
o1では、機械学習、深層学習、自然言語処理と、正しい技術が挙げられています。
もう一つ、興味深い事例を共有します。
突然ですが、問題です。
A~Dの中で3人は正直者で、1人が嘘つきです。嘘つきはだれでしょう?
A:Dはうそをついている。
B:僕はうそをついていない。
C:Aはうそをついていない。
D:Bはうそをついている。
答えを出す前に、4oとo1にも聞いてみましょうか。
———————————————————————————————————————————
——————————————————————————————————————————————
答えは、Dですよね。
4oは言葉の意味を理解しておらず、o1は正確に理解できていると言えます。
念のため5回別のチャットで質問しましたが、全て同じ回答でした。
現時点の結論は、実務上で必ずo1を用いた方が良いのは、専門的なコーディングにおいてです。
しかし、より正確なアウトプットが出力されることは示した通りです。
コストや回答速度の変化によって、上位互換になりうるポテンシャルを秘めていますし、
o1でなければならない実務が、これから出てくる可能性も十二分にあります。
都度記事にしていきますので、今後もお楽しみに!
執筆、編集作業の所要時間
-
所要時間: 65分
-
人間: 60分
-
AI: 5分
-
内訳
-
メンバーへのインタビュー(by 人間):30分
-
記事執筆(by 人間): 30分
-
誤字脱字の確認(by AI): 5分
-
人間のみで記事作成した場合に想定される所要時間: 70分
-
AIによる所要時間削減率:7%
企業担当者の連絡先を閲覧するには
会員登録を行い、ログインしてください。