Home
News
About
English
Español
中文
日本語
AIニュース
English
Español
中文
日本語
Compact View
The Verge
Apr 13, 2026
Anthropicを含む競合他社を打ち負かすためのOpenAIの最新内部メモを読む
OpenAIの最高収益責任者Denise Dresser氏は、競合優位性を維持するため、エンタープライズ向け統合プラットフォームへの戦略転換を提示しました。
The Verge
Apr 13, 2026
Microsoft、365 Copilot 向けに OpenClaw 類似の AI ボットをテスト中
Microsoft は 365 Copilot 向けに、メールやカレンダー管理などのタスクを自律的に行う OpenClaw 類似の AI エージェントをテストしています。
TechCrunch
Apr 13, 2026
Vercel CEOのGuillermo Rauch氏、AIエージェントによる収益急増を受けIPOの準備が整ったことを示唆
VercelのGuillermo Rauch CEOは、AIエージェント主導の急成長を背景に、同社がIPOに向けて準備万端であることを示唆しました。
The Verge
Apr 13, 2026
Mark Zuckerberg氏が会議で自身の代わりとなるAIクローンを構築していると報じられる
Metaは、Mark Zuckerberg氏の言動や声を学習させたAIアバターを開発し、従業員との対話に活用する計画であると報じられています。
Engadget
Apr 13, 2026
MetaがMark ZuckerbergのAIクローンを構築していると報じられている
Metaは、従業員に助言を提供するため、Mark Zuckerbergの振る舞いを学習させたAIを開発しています。
PC Guide
Apr 13, 2026
LinuxカーネルはAI生成コードを許可、バグについては「全責任」を負う
LinuxカーネルはAI生成コードを受け入れるが、バグについては提出者が全責任を負う。
The Verge
Apr 13, 2026
Sam Altman、2度目の襲撃標的か
No Molotov’s this time.
TechCrunch
Apr 13, 2026
最大の軌道上コンピューティングクラスターが稼働開始
カナダの Kepler Communications は最大の軌道上コンピューティングクラスターを運用しており、Sophia Space と協力して宇宙空間でのソフトウェア処理を試験しています。
TechCrunch
Apr 12, 2026
トランプ政権の当局者が銀行にAnthropicの「Mythos」モデルのテストを推奨している可能性
財務省と連邦準備制度の当局者が、大手銀行に対しAnthropicの新しいAIモデル「Mythos」を脆弱性検出のためにテストするよう促していると報じられました。
Fortune
Apr 12, 2026
Palantir CEOはAIが「人文学系の仕事を破壊する」と述べつつも、職業訓練を受けた人々には「十分すぎるほどの仕事」があると語る | Fortune
PalantirのCEO Alex Karp氏は、AIが人文学系の職を奪う一方、職業技能を持つ人々の需要は高まると主張しています。
TechCrunch
Apr 12, 2026
Apple、次期スマートグラス向けに4つのデザインをテスト中と報じられる
Appleは2027年の発売に向け、ディスプレイ非搭載でカメラや音声機能に特化した4種類のスマートグラスを開発中と報じられています。
TechCrunch
Apr 12, 2026
LLMからハルシネーションまで、AI関連の共通用語を分かりやすく解説
人工知能分野で使用される重要な用語を網羅し、その定義を平易に解説した用語集です。
TechCrunch
Apr 12, 2026
HumanX カンファレンスでは、誰もが Claude について語っていた
HumanX カンファレンスにおいて、Anthropic の Claude が広く支持を集めており、OpenAI の ChatGPT からの関心のシフトが目立ちました。
The Verge
Apr 12, 2026
AIコード戦争が激化している
AIを活用したコーディングツールが急速に進化し、開発者の生産性を高めると同時に、ソフトウェア業界を再編し、非プログラマーによるアプリ開発も可能にしています。
TechCrunch
Apr 11, 2026
Sam Altman、自宅襲撃事件と「扇動的」なニューヨーカー誌の記事に対し回答
OpenAIのCEOであるSam Altmanは、自宅への襲撃事件と自身の信頼性を問うニューヨーカー誌の報道に対し、自身の反省と見解を表明しました。
The Verge
Apr 11, 2026
私の子鹿のぬいぐるみは、Mitskiの父親がCIAの工作員だったと教えてくれた
ある記者がAI搭載のぬいぐるみ「Fawn Friends」を体験し、デジタルな相棒が持つ複雑で不気味な役割について考察します。
The Verge
Apr 11, 2026
イランはいかにしてホワイトハウスをネット上の煽り合いで打ち負かしたか
イランはAI生成のプロパガンダや超現実的なデジタルコンテンツを駆使し、米国との紛争において世論戦をリードした。
Novara Press
Apr 10, 2026
イランは負けていない——そしてそれこそがトランプの停戦における最も危険な結果である - Novarapress
米イラン間の最近の停戦は戦略的膠着状態を意味し、イランは激しい軍事的圧力にもかかわらず核心的な目標を維持した。
Cbsnews
Apr 10, 2026
連邦準備制度理事会(FRB)議長Jerome Powell氏、財務長官Bessent氏と大手銀行のCEOらが、Anthropic社のMythosモデルを巡り協議
FRB議長と財務長官が大手銀行CEOらと会談し、Anthropic社の新しいAIモデル「Mythos」がもたらすサイバーセキュリティリスクについて協議しました。
TechCrunch
Apr 10, 2026
ストーカー被害者がOpenAIを提訴、ChatGPTが加害者の妄想を助長し警告を無視したと主張
ストーカー被害者の女性が、ChatGPTが加害者の妄想を助長し、OpenAIが自身の警告を無視したとして同社を提訴しました。
The Verge
Apr 10, 2026
Fear and loathing at OpenAI
The Vergecast は、OpenAI における Sam Altman の混乱したリーダーシップと、AI ガバナンスの本質に関する広範な問題を検証します。
The Verge
Apr 10, 2026
Z世代のAIに対する愛憎関係
ギャラップの調査によると、Z世代はAIの長期的な影響に懸念を抱きつつも、仕事や学業で活用し続けていることが分かりました。
The Verge
Apr 10, 2026
Microsoft、Windows 11アプリからCopilotボタンの削除を開始
Microsoftは、ユーザーインターフェースを整理するため、メモ帳やSnipping Toolなど複数のWindows 11アプリからCopilotボタンを削除しています。
OpenAI
Apr 10, 2026
Applications of AI at OpenAI
OpenAIは、ChatGPTやCodex、APIなどのツールを通じて、一般ユーザーや開発者にAIモデルの活用環境を提供しています。
OpenAI
Apr 10, 2026
ChatGPT でのブレインストーミング
ChatGPTは構造的な思考パートナーとして、アイデアの創出から実行可能な計画の立案までを支援します。
OpenAI
Apr 10, 2026
マーケティングチームのためのChatGPT
ChatGPTは、マーケティングチームのキャンペーン計画、コンテンツ作成、データ分析を効率化し、戦略的な業務を加速させます。
OpenAI
Apr 10, 2026
ChatGPT で書く
ChatGPT は、職場における文書の起草、推敲、トーン調整を支援し、効率的なコミュニケーションを可能にするライティングツールです。
OpenAI
Apr 10, 2026
研究のための ChatGPT
ChatGPTは情報の統合やソースの検証、構造化されたレポート作成を通じて、研究の効率化と意思決定の迅速化を支援します。
OpenAI
Apr 10, 2026
AIの責任ある安全な利用
本ガイドは、人間による監視、ポリシー遵守、情報の検証を重視し、ChatGPTを責任を持って安全に利用するためのベストプラクティスを提示しています。
OpenAI
Apr 10, 2026
プロンプトの基礎
本ガイドでは、ChatGPT からより的確な回答を得るための、明確な指示や文脈の設定、試行錯誤の重要性について解説します。
OpenAI
Apr 10, 2026
カスタムGPTの使用
カスタムGPTは、特定のタスク向けに最適化されたChatGPTの拡張機能で、反復作業の自動化や一貫したアウトプットの生成を可能にします。
OpenAI
Apr 10, 2026
ChatGPTのパーソナライズ
OpenAIは、カスタム指示、メモリ、スキル機能を活用して、ChatGPTの挙動を個々のニーズに合わせて最適化する方法を解説しています。
OpenAI
Apr 10, 2026
ChatGPT for customer success teams
ChatGPTは、データの統合、コミュニケーションの効率化、業務の標準化を通じて、カスタマーサクセスチームの管理業務の負担を軽減します。
OpenAI
Apr 10, 2026
マネージャーのためのChatGPT
マネージャーが戦略立案、チーム管理、コミュニケーション、意思決定などの業務をChatGPTで効率化する方法を解説します。
OpenAI
Apr 10, 2026
ChatGPT でのファイル操作
ChatGPT を使用すると、会話内でファイルを直接アップロードし、分析、編集、生成を行うことができます。
OpenAI
Apr 10, 2026
ヘルスケア
この記事では、臨床医が診断、記録、患者説明、ケアの移行を支援するために使用できるプロンプトのテンプレートを紹介しています。
OpenAI
Apr 10, 2026
ChatGPT を始める
ChatGPT は、自然言語によるプロンプトや音声機能を通じて、思考や執筆、問題解決を支援する会話型 AI アシスタントです。
OpenAI
Apr 10, 2026
金融サービス
OpenAIは、金融機関が規制環境下でAIを安全に導入・活用できるよう、厳選されたリソースやAIアシスタントを提供しています。
OpenAI
Apr 10, 2026
ChatGPTで画像を生成する
ChatGPTを活用すれば、簡潔な自然言語プロンプトで高品質なオリジナル画像を効率的に生成・調整できます。
OpenAI
Apr 10, 2026
ChatGPT を営業チームに活用する
ChatGPTは、見込み客調査、商談準備、アウトリーチ、商談管理などの業務を自動化し、営業チームの生産性を向上させます。
The Verge
Apr 9, 2026
フロリダ州がOpenAIに対する調査を開始
フロリダ州のJames Uthmeier司法長官は、国家安全保障上の懸念とChatGPTの犯罪利用の疑いからOpenAIの調査を開始しました。
TechCrunch
Apr 9, 2026
ChatGPTがついに月額100ドルのProプランを提供
OpenAIは、開発者のコーディング能力を高め、AnthropicのClaudeに対抗するため、月額100ドルのChatGPT Proプランを発表しました。
TechCrunch
Apr 9, 2026
フロリダ州司法長官、ChatGPTが関与したとされる銃撃事件を巡りOpenAIの捜査を発表
フロリダ州司法長官は、ChatGPTが2025年のフロリダ州立大学での銃撃事件の計画に使われたとの疑いを受け、OpenAIの捜査を開始しました。
TechCrunch
Apr 9, 2026
データ侵害を受け、評価額100億ドルのスタートアップMercorが苦境に
AIスタートアップのMercorは、LiteLLMに関連するデータ侵害により、契約の停止や訴訟など深刻な影響に直面しています。
TechCrunch
Apr 9, 2026
Meta AIアプリ、Muse Sparkの発表を受けてApp Storeで5位に浮上
Muse Sparkモデルの公開に伴い、Meta AIアプリが米国App Storeで5位まで急上昇しました。
TechCrunch
Apr 9, 2026
Anthropicはインターネットを守るためにMythosのリリースを制限しているのか、それともAnthropic自身を守るためなのか?
Anthropicが強力なモデル「Mythos」の公開を制限した背景には、サイバーセキュリティ対策と自社のビジネスモデル防衛の両面があるとの指摘がなされています。
TechCrunch
Apr 9, 2026
GoogleとIntel、AIインフラのパートナーシップを強化
Google CloudとIntelは、カスタムAIプロセッサの共同開発とIntel Xeonチップの活用を目的とした複数年のパートナーシップを拡大しました。
The Verge
Apr 9, 2026
GoogleのGemini AIは3Dモデルとシミュレーションで質問に回答可能
GoogleのGeminiがアップデートされ、ユーザーがリアルタイムで操作可能な3Dモデルやシミュレーションの生成が可能になりました。
TechCrunch
Apr 9, 2026
SierraのBret Taylor氏、「ボタンをクリックする時代は終わった」と語る
SierraのCEO Bret Taylor氏は、企業向けタスクにおいて自然言語が従来のクリック式ソフトウェアインターフェースに取って代わると予測しています。
Gemini
Apr 9, 2026
Gemini アプリがインタラクティブなシミュレーションやモデルを生成できるようになりました。
Geminiアプリがインタラクティブなシミュレーション生成に対応し、動的な視覚化を通じて複雑な概念の理解を深められるようになりました。
TechCrunch
Apr 9, 2026
Amazon CEOが年次株主向け書簡でNvidia、Intel、Starlinkなどを牽制
AmazonのAndy Jassy CEOは年次株主向け書簡で、自社開発ハードウェアの成功を強調し、大規模な設備投資の正当性を主張しました。
Fortune
Apr 9, 2026
ホワイトカラーの労働者がAIに静かな反乱、80%が導入命令を断固拒否 | Fortune
調査によると、スキル不足や不信感から、企業のAIツール導入命令を約80%の従業員が回避または拒否していることが判明しました。
The Verge
Apr 9, 2026
Googleは自分自身のディープフェイク作成を容易にする
YouTubeは、クリエイターが自分の姿と声をリアルに複製できるAIベースのアバター作成機能を導入します。
CNBC
Apr 9, 2026
MetaがCoreWeaveへの追加支出210億ドルを決定、AIコストは上昇を続ける
Metaは、急速に拡大するAI戦略を支えるため、CoreWeaveに対して新たに210億ドルのクラウドインフラ投資を行うことに合意しました。
Firstpost
Apr 9, 2026
Vance氏は、イランが10項目の提案を3つの異なるバージョンで送り、そのうち1つは「ChatGPTによって書かれた」と述べている
JD Vance氏は、イランが3つの異なる10項目提案を提出し、そのうち1つはAIが作成した可能性があるため混乱が生じていると主張した。
The Verge
Apr 9, 2026
Geminiにプロジェクト整理のためのノートブック機能が登場
GoogleのGemini AIに、プロジェクト整理のためのファイルやチャットを保存する「ノートブック」機能が追加されました。
OpenAI
Apr 9, 2026
CyberAgentはChatGPT EnterpriseとCodexで加速する
CyberAgentは、ChatGPT EnterpriseとCodexを業務に導入し、全社的な生産性向上と意思決定の質の改善を実現しています。
the Guardian
Apr 8, 2026
オハイオ州の男、AIによる性的に露骨な画像の制作で新法に基づき初の有罪判決
James Strahler IIが、AI生成による同意のない性的な画像の拡散を禁じる「Take It Down Act」に基づき、米国で初めて有罪判決を受けました。
TechCrunch
Apr 8, 2026
PokeはAIエージェントの利用をテキスト送信と同じくらい簡単にします
Pokeは、テキストメッセージを通じてAIエージェントを利用可能にし、複雑なインストールなしでタスクの自動化を実現するスタートアップです。
The Verge
Apr 8, 2026
OpenAIが経済提案を行った—それに対するDCの評価
OpenAIがAI経済対策の提案を発表しましたが、同社の過去のロビー活動の歴史から、ワシントンの専門家らは懐疑的な見方を示しています。
TechCrunch
Apr 8, 2026
AWSのボスが、AnthropicとOpenAIの両方に数十億ドルを投資することが「許容される対立」である理由を説明
AWSのMatt Garman CEOは、AnthropicとOpenAIへの二重投資について、パートナーと競合しながら共存してきた同社の歴史に基づき、問題ないと述べています。
Phoronix
Apr 8, 2026
Hugging Face、AIモデル実行の安全性を高めるためSafetensorsをPyTorch Foundationに寄贈
Hugging Faceは、AIモデルのセキュリティとパフォーマンス向上のため、Safetensors形式をPyTorch Foundationに寄贈しました。
The Defiant
Apr 8, 2026
Visa、AIエージェント向けショッピングインフラを世界展開
Visaは「Intelligent Commerce」プラットフォームを世界展開し、AIエージェントによる代理購入や決済を可能にしました。
The Verge
Apr 8, 2026
Metaが「Muse Spark」という新しいモデルでAI競争に再参入
Metaは、自社のソーシャルプラットフォームやハードウェア全体に統合される新しいマルチモーダルAIモデル「Muse Spark」を発表しました。
TechCrunch
Apr 8, 2026
OpenAI、児童性的搾取の増加に対処するための新しい安全ブループリントをリリース
OpenAIは、より迅速な検出と改善された報告を通じて、AI関連の児童搾取に対抗するための新しいブループリントを発表しました。
TechCrunch
Apr 8, 2026
Databricks共同創設者が権威あるACM賞を受賞、「AGIは既に到来している」と語る
DatabricksのCTO Matei Zaharia氏がACM計算賞を受賞し、AGIは既に存在しているが人間の基準で測るべきではないと述べた。
Gemini
Apr 8, 2026
Geminiのノートブックでプロジェクトを簡単に管理しましょう
Geminiに新機能「ノートブック」が登場。NotebookLMと連携し、チャットやファイルを整理してプロジェクトを効率的に管理できます。
Theregister
Apr 8, 2026
AIインフラプロジェクトのわずか28%が完全に元が取れる、調査で判明
Gartnerの調査によると、AIインフラプロジェクトの28%しか完全なROIを達成しておらず、多くは期待外れやデータ不足で失敗しています。
TechCrunch
Apr 8, 2026
AtlassianがConfluenceに視覚的なAIツールとサードパーティエージェントを導入
AtlassianはConfluenceにRemixとサードパーティエージェントを導入し、データ可視化とプロトタイプ作成を効率化します。
TechCrunch
Apr 8, 2026
Googleがオフラインで動作するAIディクテーションアプリをひっそりとリリース
Googleは、AIを活用してオフラインでの文字起こしと文章校正ができるiOSアプリ「Google AI Edge Eloquent」を公開しました。
ニュースをもっと見る
Best LLMs and AI Chatbots
Data Source:
Artificial Analysis
Rank
Model
Score
1
Gemini 3.1 Pro Preview
(Google)
57.2
2
GPT-5.4 (xhigh)
(OpenAI)
56.8
3
GPT-5.3 Codex (xhigh)
(OpenAI)
53.6
4
Claude Opus 4.6 (Adaptive Reasoning, Max Effort)
(Anthropic)
53.0
5
Muse Spark
(Meta)
52.1
6
Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)
(Anthropic)
51.7
7
GLM-5.1 (Reasoning)
(Z AI)
51.4
8
GPT-5.2 (xhigh)
(OpenAI)
51.3
9
Qwen3.6 Plus
(Alibaba)
50.0
10
GLM-5 (Reasoning)
(Z AI)
49.8
11
Claude Opus 4.5 (Reasoning)
(Anthropic)
49.7
12
MiniMax-M2.7
(MiniMax)
49.6
13
Grok 4.20 0309 v2 (Reasoning)
(xAI)
49.3
14
MiMo-V2-Pro
(Xiaomi)
49.2
15
GPT-5.2 Codex (xhigh)
(OpenAI)
49.0
16
GPT-5.4 mini (xhigh)
(OpenAI)
48.9
17
Grok 4.20 0309 (Reasoning)
(xAI)
48.5
18
Gemini 3 Pro Preview (high)
(Google)
48.4
19
GPT-5.1 (high)
(OpenAI)
47.7
20
Kimi K2.5 (Reasoning)
(Kimi)
46.8
21
GLM-5-Turbo
(Z AI)
46.8
22
GPT-5.2 (medium)
(OpenAI)
46.6
23
Claude Opus 4.6 (Non-reasoning, High Effort)
(Anthropic)
46.5
24
Gemini 3 Flash Preview (Reasoning)
(Google)
46.4
25
Qwen3.5 397B A17B (Reasoning)
(Alibaba)
45.0
26
MiMo-V2-Omni-0327
(Xiaomi)
44.9
27
GPT-5 (high)
(OpenAI)
44.6
28
GPT-5 Codex (high)
(OpenAI)
44.6
29
Claude Sonnet 4.6 (Non-reasoning, High Effort)
(Anthropic)
44.4
30
GPT-5.4 nano (xhigh)
(OpenAI)
44.0
31
KAT Coder Pro V2
(KwaiKAT)
43.8
32
GLM-5.1 (Non-reasoning)
(Z AI)
43.8
33
MiMo-V2-Omni
(Xiaomi)
43.4
34
GPT-5.1 Codex (high)
(OpenAI)
43.1
35
Claude Opus 4.5 (Non-reasoning)
(Anthropic)
43.1
36
Claude 4.5 Sonnet (Reasoning)
(Anthropic)
43.0
37
GLM 5V Turbo (Reasoning)
(Z AI)
42.9
38
Claude Sonnet 4.6 (Non-reasoning, Low Effort)
(Anthropic)
42.6
39
Qwen3.5 27B (Reasoning)
(Alibaba)
42.1
40
GLM-4.7 (Reasoning)
(Z AI)
42.1
41
GPT-5 (medium)
(OpenAI)
42.0
42
Claude 4.1 Opus (Reasoning)
(Anthropic)
42.0
43
MiniMax-M2.5
(MiniMax)
41.9
44
DeepSeek V3.2 (Reasoning)
(DeepSeek)
41.7
45
Qwen3.5 122B A10B (Reasoning)
(Alibaba)
41.6
46
MiMo-V2-Flash (Feb 2026)
(Xiaomi)
41.5
47
Grok 4
(xAI)
41.5
48
Gemini 3 Pro Preview (low)
(Google)
41.3
49
GPT-5 mini (high)
(OpenAI)
41.2
50
Kimi K2 Thinking
(Kimi)
40.9
51
o3-pro
(OpenAI)
40.7
52
GLM-5 (Non-reasoning)
(Z AI)
40.6
53
Qwen3.5 397B A17B (Non-reasoning)
(Alibaba)
40.1
54
Qwen3 Max Thinking
(Alibaba)
39.9
55
MiniMax-M2.1
(MiniMax)
39.4
56
Gemma 4 31B (Reasoning)
(Google)
39.2
57
GPT-5 (low)
(OpenAI)
39.2
58
MiMo-V2-Flash (Reasoning)
(Xiaomi)
39.2
59
Claude 4 Opus (Reasoning)
(Anthropic)
39.0
60
GPT-5 mini (medium)
(OpenAI)
38.9
61
Claude 4 Sonnet (Reasoning)
(Anthropic)
38.7
62
Grok 4.1 Fast (Reasoning)
(xAI)
38.6
63
Qwen3.5 Omni Plus
(Alibaba)
38.6
64
GPT-5.1 Codex mini (high)
(OpenAI)
38.6
65
o3
(OpenAI)
38.4
66
GPT-5.4 nano (medium)
(OpenAI)
38.1
67
Step 3.5 Flash
(StepFun)
37.8
68
GPT-5.4 mini (medium)
(OpenAI)
37.7
69
Kimi K2.5 (Non-reasoning)
(Kimi)
37.3
70
Qwen3.5 27B (Non-reasoning)
(Alibaba)
37.2
71
Claude 4.5 Haiku (Reasoning)
(Anthropic)
37.1
72
Qwen3.5 35B A3B (Reasoning)
(Alibaba)
37.1
73
Claude 4.5 Sonnet (Non-reasoning)
(Anthropic)
37.1
74
MiniMax-M2
(MiniMax)
36.1
75
NVIDIA Nemotron 3 Super 120B A12B (Reasoning)
(NVIDIA)
36.0
76
KAT-Coder-Pro V1
(KwaiKAT)
36.0
77
Claude 4.1 Opus (Non-reasoning)
(Anthropic)
36.0
78
Qwen3.5 122B A10B (Non-reasoning)
(Alibaba)
35.9
79
Nova 2.0 Pro Preview (medium)
(Amazon)
35.7
80
GPT-5.4 (Non-reasoning)
(OpenAI)
35.4
81
Grok 4 Fast (Reasoning)
(xAI)
35.1
82
Gemini 3 Flash Preview (Non-reasoning)
(Google)
35.0
83
Claude 3.7 Sonnet (Reasoning)
(Anthropic)
34.7
84
Gemini 2.5 Pro
(Google)
34.6
85
Nova 2.0 Lite (high)
(Amazon)
34.5
86
GLM-4.7 (Non-reasoning)
(Z AI)
34.2
87
DeepSeek V3.1 Terminus (Reasoning)
(DeepSeek)
33.9
88
GPT-5.2 (Non-reasoning)
(OpenAI)
33.6
89
Gemini 3.1 Flash-Lite Preview
(Google)
33.5
90
Doubao Seed Code
(ByteDance Seed)
33.5
91
gpt-oss-120B (high)
(OpenAI)
33.3
92
o4-mini (high)
(OpenAI)
33.1
93
Claude 4 Opus (Non-reasoning)
(Anthropic)
33.0
94
Claude 4 Sonnet (Non-reasoning)
(Anthropic)
33.0
95
DeepSeek V3.2 Exp (Reasoning)
(DeepSeek)
32.9
96
Mercury 2
(Inception)
32.8
97
GLM-4.6 (Reasoning)
(Z AI)
32.5
98
Qwen3 Max Thinking (Preview)
(Alibaba)
32.5
99
Qwen3.5 9B (Reasoning)
(Alibaba)
32.4
100
Gemma 4 31B (Non-reasoning)
(Google)
32.3