o4-miniとo3とGPT 4.1とclaude 3.7 sonnetの比較!どっち!?

2025年4月17日

chatgptとclaudeの比較記事です。随時更新しています。

Contents

1 o4-miniとo3とGPT 4.1の比較！どっち!?
2 GPT 4.1とclaude 3.7 sonnetとGemini 2.5 proの比較!どっち!?
3 claude 3.7 sonnetとo3-miniとo1とGPT 4.5の比較!どっち!?
4 chatgpt o1とclaude3.5 sonnet new比較!どっち!?
5 claude3.5 sonnet newとchatgpt o1-previewの比較!どっち!?
6 chatgpt o1-previewとclaude3.5 sonnetの比較!どっち!?
7 chatgpt 4oとclaude3 opusの比較!どっち!?
8 chatgpt 4oとclaude3.5 sonnet比較!どっち!?
- 8.1 GPT-4o miniとは
9 ChatGPTのデメリット

o4-miniとo3とGPT 4.1の比較！どっち!?

色々試したみたけど、フロントエンドのコーディング（デザイン）は今のところ o3 / o4-mini よりも GPT-4.1 のほうが上だな。
でもこれも時間の問題で、ここが合流してGPT-5になるイメージが余裕で付くよなもう。
なんだかんだOpenAI強すぎる。
— 炎鎮🔥 – ₿onochin – (@super_bonochin) April 17, 2025

o3 と o4-mini はコーディングが非常に得意なので、それらをより簡単に使えるようにする新製品「Codex CLI」をリリースします。

これはあなたのコンピュータ上で動作するコーディングエージェントで、完全にオープンソースとして本日公開されており、今後急速に改良されることを期待しています。 https://t.co/BxDqrxGDRw
— シバイヌおやびん（投資系VTuber） (@yasutaketin) April 17, 2025

Codex CLIはnpmインストールしてローカルで使えるものです。APIキーの設定が必要なので従量制料金ということですね。

OpenAI Codex CLI – Getting Started
(中略)
Authenticate: Export your OpenAI API key
https://help.openai.com/en/articles/11096431-openai-codex-cli-getting-started

今のところ、o4-miniとo3は本家の契約で、GPT 4.1はAIエディタWindsurfで利用していく予定です。詳細はこちらです。

ithands

プロモーションコードあり!Windsurfエディタの使い方 | ithands Windsurfの有料版を契約しました。 Windsurfの有料プランのプロモーションコード(友達紹介) Windsurfは有料版を契約しているため、友達紹介できます。 Windsurf 上記の友達…

GPT 4.1とclaude 3.7 sonnetとGemini 2.5 proの比較!どっち!?

GPT 4.1使ってみたけど、すごく忠実にコードを書いてくれる。

Claude 3.7いいじゃん！からのGemini 2.5 pro最高！からの結局GPTだよな！という流れ。
— tradetool@億り人 – 米国株投資 (@tradetool1) April 15, 2025

claude 3.7 sonnetは説明はうまいんだけど、コーディングがジャジャ馬という気がします。
Gemini 2.5 proは前と比較したらよくなったと思うけど、o1の方がいい気がします。AIエディタでは画像解析を拒否されます…。
GPT 4.1はシンプルでコスパよく、忠実でいい感じ。

GPT 4.1はAIエディタWindsurfで利用できます。詳細はこちらです。

ithands

claude 3.7 sonnetとo3-miniとo1とGPT 4.5の比較!どっち!?

Aider LLM Leaderboardsをみると次のような順番👀 https://t.co/6C8n9aDMsw

1.claude-3-7-sonnet(thinking)
2.o1
3.claude-3-7-sonnet
4.o3-mini-high

実際の感覚はこう
Claude 3.7 Sonnet:エラーハンドリングを踏まえたコード(複雑)、説明が優しい
o3-mini-high：シンプルなコード、デバッグ
— neru【個人開発作家*AI研究】 (@neruplan) March 16, 2025

【Claudeの新モデル「Claude 3.7」】

コーディング性能がo1・o3-miniを超え、開発者の間で大注目のAIモデル。これはもう開発にはClaude 3.7一択かも。 pic.twitter.com/CP4rRQ0cYI
— けんぞー｜20代のAI仕事術 (@kenzo_ta55) February 25, 2025

ChatGPT gpt-4.5 がPlusユーザーでも利用可能となりました
4.5にモデルごとの特徴を聞いてみたのがこちら🖼️

4.5は共感力が高いのと4oより速度も高いので、普段使いとして良さそうですね
o1は高度なリサーチをする場合に有用
o3-mini, o3-mini-highはプログラミングのお供かな… https://t.co/677sviRyig pic.twitter.com/JXqnyGeI8y
— kosk(💙, 🔄) (@kosk_t) March 6, 2025

GPT-4.5とコーディングしてたが，コーディングだとやっぱりo3-mini-highかo1がいいなぁ
日常会話とか一般的な話とかなら4.5のほうに優位性があるのかもしれんが
— まぐろ (@maguroIsland) February 28, 2025

GPT-4.5でカービィのSVGを作成 https://t.co/4HzjdIlfoR pic.twitter.com/yZF5qKRa23
— d (@d_1d2d) February 28, 2025

Aider LLM Leaderboardsによれば、コーディングではGPT 4.5はDeepSeek V3やo3-miniよりスコアが下で、Claude 3.7 Sonnetには遠く及ばないhttps://t.co/OGbOMRHIHi
— あずりえる🌸 (@poyothon) February 28, 2025

Claude-3.7は0→1が得意
o3-miniはデバッグが得意

これってなんでなんですかね、、？
石川さんが考える根拠などあったりされますか？
— ArtI (@YoshidaTaiki) February 25, 2025

7. No use of multiple AI models

1 AI model can't do everything. Use different models for different scenarios.

In Cursor/Windsurf:

Use Claude sonnet 3.5 for coding (yes for executing code it is better than 3.7.)

Use GPT o1/o3-mini-high to debug complex errors.

Use Gemini…
— Cj Z 🎯 (@cj_zZZz) March 18, 2025

実装テストをしてみましたが、claude 3.7 sonnetがまた一歩上にいきましたかね。

claude 3.7 sonnetの方がエラーハンドリングをしたしっかりと実装。説明はclaudeの方がわかりやすいです。

o3-mini-highの方はシンプルでわかりやすいコードという気がします。デバッグはo3-mini-highの方がよいという情報もあります。

コーディング能力（体感）
ChatGPT o1-pro > Claude sonnet 3.7 > ChatGPT o1 >>> ChatGPT 4o
— matsu (@matsueng) March 10, 2025

やっぱo1が一番かな・・・他のAIも試してるけど。
思考深度が深い感じする。
受け答えは4.5がいいかな。
ちょうどいい感じなのはClaude 3.7 Sonnetって感じ。すごくバランスがいい。

自分がコーディングで使うならo1しかないかな…。
— Shingo416 (@n416) February 28, 2025

o3-mini-highよりo1の方がよいですかね。バランスがよいです。ただ回数制限があるため使い所を絞ります。o1は数が限られているため、ドキュメントの作成はclaude 3.7 sonnetにさせた方がよさそうです。

一長一短あります。

chatgpt o1とclaude3.5 sonnet new比較!どっち!?

chatgpt-preview版が終わって正式なchatgpt o1となりました。画像添付も可能になりました。

現在はchatgpt o1を使うことが増えています。claudeは今後メジャーアップデートがなければ解約する予定です。

赤字のOpenAIですが、chatgpt proは200ドルとなりました。すぐに使う予定はありませんが、外注さんや従業員よりは安いですかね。

口コミを拾ってみました。

UnityのUIをUI Toolkitで表示する際、シーンを再読み込みすると一部の要素が表示されない問題があったんですが、Claudeでは解決できず、ChatGPT o1 Proにお願いしたところ解決しました。ここでは実力の差が出ましたね、、。
— やのせん@VR/メタバース教育 (@yanosen_jp) December 15, 2024

長く検証したところ、現在はChatGPT o1の方が圧倒的によい気がします。Claude君の出番が減っています。

コードの解説はClaude君の方がわかりやすいけど、リードプログラマはChatGPT o1に任せたいですね。僕は仕様・設計、アシスタントプログラマ、デバッガーですかね。ChatGPT o1君が解決できないときは、アシスタントプログラマの出番です＞＜

claude3.5 sonnet newとchatgpt o1-previewの比較!どっち!?

Here’s the latest benchmark comparison between Claude 3.5 Sonnet and OpenAI o1 Preview.
(Some o1 data is roughly converted, created by Claude 3.5 Sonnet New)

Confirming its coding ability is amazing. 🤯
Crucially, Sonnet 3.5 achieves this without needing as many tokens as o1. pic.twitter.com/0LEaWmgE2c
— Augusdin (@augusdin) October 23, 2024

スコア的には大差ないので、実際に利用してみて実践でどちらが使えるかですかね。

試したところ次のような感じです。

claude3.5 sonnet newの方が新しい情報に疎いです。たとえば「iOS 18はまだリリースされていない」と言います。GPT君はサーチして調査してくれます。

校正は以前はGPT君の方が積極的によくも悪くもなおしてくれる感じだったのですが、Claude君もかなり積極的に修正してくれる形になってきました。Claude君推し。

ChatGPT君はよく数を数えまちがえます。無難な仕事はClaude君。

After Effectsなどのグラフィックの質問はChatGPT o1の方がよさそうです。

コーディングは今のところ一長一短です。どっちもいいところがありますね。どっちもダメなところもあります。ただ、推論能力などはo1-previewの方がややいいかなという印象を持っています。

chatgpt o1-previewとclaude3.5 sonnetの比較!どっち!?

(追記)最近、claude3.5 sonnetの劣化を感じています。とくに前の流れを失念します…。

少し難しいことをやると困ることが多々あります。自力解決の方が早いことも多々あり…。(´・ω・`)

そんなとき、OpenAIのo1-preview、o1-miniが2024年9月にリリースされました。

軽く調査しました。再びchatgptでしょうか。

Difyだと、OpenAI o1-previewがフリーユーザーでも使えると思います。私はプログラミングは、o1-previewとclaude 3.5 sonnetで並行処理させるDifyのエージェントを使ってます。これが今のところプログラミングの最適解じゃないかな🤔

VS codeのGithub copilotも便利だけど、まだGPT-4oだと思います。 https://t.co/Ms4ojpuW5T pic.twitter.com/nhCcW0orVV
— 旅人🇬🇧 (@Tomoto1234567) September 13, 2024

DifyはXserver VPSで利用できます。

ithands

Docker!Dify!Xserver VPSで個人開発! 個人開発をしているため、Xserver VPSの個人開発を調査しました。 Xserver VPSやxserver for gameの友達紹介クーポンはこの記事ではなく、こちらより取得できます。お安く…

最近よく使うLLM (頻度順):
Web: o1-preview > Claude 3.5 Sonnet
API: Gemini 1.5 Flash > Gemini 1.5 Pro > GPT-4o-mini
Local: Llama 3.1 70B, 8B > CALM3-22B-Chat > Mixtral-8x7B
他: Gemma 2 2B
— 逆瀬川 (@gyakuse) September 17, 2024

OpenAI ChatGPT o1-preview
「すごいけど "これだ！"」ってものなかったけど、プログラミングのリファクタリングにおいては GPT-4o, Claude 3.5 Sonnet, Gemini 1.5 Pro より圧倒的な気がする。 pic.twitter.com/XTHk46f1UX
— 2001Y｜田村義希(Yoshiki Tamura) (@Y20010920T) September 15, 2024

Claude 3.5 sonnet(プログラミング用にシステムプロンプトを最適化済み)であの手この手でpromptを変えてみても解決できなかったPythonプログラムのエラーが、o1-previewで一撃で解決した。
※依頼文は同様かつ、Claudeのシステムプロンプトに入れてある長文のプロンプトをそのままchatベタ貼りで投下
— Yuki Serizawa (@yk_srzw) September 14, 2024

ChatGPT o1-preview 使ってみたけど、やっぱり Claude 3.5 Sonnet と Artifacts の生成の方が自分の使い方には合ってるなぁ…
— Niishi Kubo | GitLab,Limeboard (@n11sh1_) September 14, 2024

ChatGPT o1-previewとClaude 3.5 sonnetのアルゴリズム問題の解決能力とシステム設計面接での能力を比較しました。全体的に、ChatGPT o1-previewは両方の分野でClaudeを大きく上回っていますhttps://t.co/sH0w9UdYq1 pic.twitter.com/KFrMQ7nnwU
— Zhenjia Zhou (@zhenjiazhou) September 14, 2024

o1-previewでモデリングまで行ってドキュメントを作成
↓
ドキュメントを元にClaude 3.5 sonnetで実装

が最も良いコードが作れるっぽい。
— りず (@rizumita) September 13, 2024

淡々としたツンデレだった GPT と比べて、o1-preview が能弁になったことは体感できる差。ただ、コーティング能力は Claude 3.5 Sonnet、gemini-1.5-pro-exp-0827 の方が高いように感じる。ゲームが遊べる。
— きのぴー@「Cursor完全ガイド」 (@kinopee_ai) September 13, 2024

o1-preview （と o1 ）は頻繁に使うには高いし待ち時間も長いので用途は限られそう。
他方、 o1-mini は GPT-4o や Claude 3.5 Sonnet と同じ価格帯でレイテンシも小さいので、プログラミングで大量に使われそう。
8 〜 9 割のプログラマよりもコーディング能力の高いモデルがこの価格なのはやばい！ https://t.co/c5g0fHm7oh
— 生成 AI レーダー (@gen_ai_radar) September 13, 2024

ChatGPT o1-preview
Claude 3.5 Sonnetと比較してプログラミング能力は体感1.5倍ぐらいあるな。

とりあえず開発で悩んでた箇所にバンバン答え出してくれるので天国。
— Sho (@Vitalogy_jp) September 14, 2024

はじめてコード系でClaude Sonnet 3.5ではエラー原因を特定できなくて、o1-previewでは特定できたというパターンに遭遇した。初めてo1の能力を実感した
— Jun Tamaoki / 玉置絢 (@OKtamajun) October 12, 2024

プログラミング性能の高いLLM(要はチャットボットアリーナの coding のランキング

1 GPT o1 preview $60 /1M tokens out
1 GPT o1 mini $12
2 GPT 4o $10
5 claude 3.5 sonnet $15

o1 って今まで openAI に API だけで $100 以上払った客しか使わせてもらえないらしい
ちょっと頑張って課金するか… pic.twitter.com/BXaYkrU8x8
— NITTA, katsuyoshi（新田勝貴） (@read_me) October 11, 2024

AIの見直し!
Claude 3.5 sonnetの劣化を感じる。特に前の流れを失念する。o1-previewを導入！回数的に本家か!

-Cursor
>10 o1-mini uses per dayhttps://t.co/SR28I86qTq

-本家
>50 queries per week for o1-preview and 50 queries per day for o1-mini.https://t.co/3JNH60Z7RY #GitHub Copilot
— neru【個人開発作家*AI研究】 (@neruplan) September 25, 2024

意見は多少わかれるようですが、いったんクロード君降格ですかね…。ただし、o1-previewは厳しい制限がありますからしばらくはperplexity AIでclaudeをサブで利用しましょうかね。文章や軽い作業をclaude君に任せましょうか。

ithands

Perplexity AIのクーポン!Perplexity proのプロモーションコード | ithands Perplexity AIを契約しました。 perplexity aiのクーポン!perplexity proのプロモーションコード有料課金しているため紹介できます。 perplexity ai 画像のように$10 refe…

As I've said many times before, don't sleep on Google.

Gemini new model : Gemini-Exp-1114

Overall Ranking: 1

Math: 1
Hard Prompts: 1
Creative Writing: 1
Vision: 1
Coding: 3

I wish Google would make Gemini number 1 in coding too.

Now, OpenAI has to release o1, they… pic.twitter.com/50PUSZ4jmf
— AshutoshShrivastava (@ai_for_success) November 14, 2024

ちなみに、Twitterで出回っているランキングのサイトですが、こちらのようです。

chatgpt 4oとclaude3 opusの比較!どっち!?

軽く調査しました。

uiなど特殊なことができることを除けば、基本的にclaude opusの方が優秀という答えのようですね。

Claude解約しようか迷うー。日本語性能、日本人らしい表現はまだClaudeの方が上な気がするんだよなー
どう思います？
— あるだま｜ChatGPT 自然言語プログラミング (@ARDAMA) May 14, 2024

ChatGPT4,ChatGPT4oともに、Next.jsのapp routerよくわかってない感じする。たびたびpage routerの方のコードを示すし、違うよって言っても直ってなかったり。
Claude Opusが強いなあ。
— 大森翔吾 (@dai_mori219) May 16, 2024

Next.jsは個人的にも利用しているため参考になりますね。

お話作りにおすすめのAI、あります！

総合点ではChatGPTのGPT-4oが一番優秀ですが、自然な日本語の性能では今もClaude3 Opusが一番です（課金必要）。

まずは、GPT-4oを試してみて（回数制限はあるが無料でもOK）、良さそうならそのまま課金して使うか、Claude3も試して比較してみるのが良いかと。
— 岡安モフモフ（アーガイル社長）＠ChatGPTやClaudeでサービスつくる人、SNSマーケ歴15年 (@shields_pikes) May 16, 2024

医学系の日本語抄録作成もClaude3Opusの方が医師っぽい単語選択です
少なくとも医学系の日本語はClaude3の方が良さそうです

GPT-4oに人が流れてClaudeが過疎ってOpusの利用制限が緩くなる事を願います笑

ChatGPTのアプリの音声チャットは全然繋がらないですね🥲
— 限界助教|ChatGPT/Claudeで論文作成と科研費申請 (@genkAIjokyo) May 14, 2024

個人的にもclaude3 opusのまま動かずメインは変わりません。詳しくはこちらの記事をみてください。

ithands

無料版は!?Claude 3.7 sonnetの利用制限/回数制限や料金! | ithands Claudeの制限や料金に関するまとめです。現在、ClaudeはWindsurf Editorで利用しています。無料版は!?Claude 3.7 sonnetの利用制限/回数制限そこそこの回数は使えますが…

perplexity aiはchatgpt 4o、claude3.5 sonnet、claude3 opusの3つが使えます。

perplexity ai

chatgpt 4oとclaude3.5 sonnet比較!どっち!?

ChatGPT4oの時はただ早くなったけど、能力落ちてない？みたいな疑惑があったけど、Claude3.5 sonnetは速さと能力も高まっている！
— 遠藤巧巳 – 生成AI開発 (@it_overseas) June 21, 2024

ChatGPT研究所さんのClaude3.5 Sonnet AGIラボに参加しています☺️。
✅ChatGPT-4oより図解や資料のレベルが高い（svg, よりリッチに)　業務で使えるレベル
✅UIフェースやゲーム開発などプロトタイプ開発に強い
✅わかりにくい概念をビジュアライズ化してくれる
✅アートに強い（そう）
— blue@プログラミングで業務効率化 (@blue201507) June 25, 2024

Claude3.5 sonnetの方がよさそうですね。とはいえ併用が理想。chatgpt 4oはperplexity AIで使っています。

ithands