Home
News
About
English
Español
中文
日本語
AIニュース
English
Español
中文
日本語
Compact View
The Verge
Feb 27, 2026
Galaxy S26 は写真の悪夢である
Galaxy S26の新しいAIカメラ機能は、写真撮影の性質を根本的に変えるため批判されています。
The Verge
Feb 27, 2026
OpenAIがAmazon、Nvidia、Softbankから1100億ドルの投資を獲得
OpenAIはAmazon、Nvidia、SoftBankから新たに1100億ドルの投資を獲得し、企業価値は7300億ドルに達しました。
Scientific American
Feb 27, 2026
LabOS AI搭載スマートゴーグルはいかにして科学における人的ミスを減らすことができるか
LabOSはAI搭載のスマートゴーグルを用いて、初心者の科学者をリアルタイムで指導し、ミスを防ぎ、トレーニングを加速させます。
TechCrunch
Feb 27, 2026
OpenAIが史上最大級のプライベート資金調達ラウンドで1100億ドルを調達
OpenAIは、AmazonとNvidiaからの主要な投資を含め、7300億ドルの事前評価額で1100億ドルのプライベート資金を確保しました。
Phoronix
Feb 27, 2026
Linux 7.0-rc2 向け多数の AMDXDNA Ryzen AI ドライバー修正
AMD は Linux 7.0-rc2 リリースに先立ち、AMDXDNA Ryzen AI ドライバーに対して多数の修正を送信しました。
CNN
Feb 27, 2026
AIが世界のメモリチップを食い尽くし、スマートフォン価格が記録的な高騰、報告書が示す
AI需要の急増によりメモリチップが不足し、スマートフォン価格が高騰し、販売に影響を与える可能性がある。
AP News
Feb 27, 2026
Fintech企業Block、AIを理由に4,000人以上を解雇 | AP通信
フィンテック企業のBlockは、AIを理由に4,000人以上の従業員を解雇しています。
OpenAI
Feb 27, 2026
OpenAIとAmazonが戦略的パートナーシップを発表
OpenAIとAWSは、Amazonによる500億ドルの投資を含む戦略的パートナーシップを発表し、AIイノベーションを加速させます。
OpenAI
Feb 27, 2026
Amazon Bedrock におけるエージェント向けステートフルランタイム環境の紹介
Amazon Bedrock は、OpenAI を搭載したステートフルランタイム環境を導入し、AWS インフラストラクチャ内で複雑なマルチステップAIエージェントワークフローを確実に実行できるようにします。
OpenAI
Feb 27, 2026
OpenAI と Microsoft からの共同声明
OpenAIとMicrosoftは、新たな外部提携にもかかわらず、IPライセンスや収益分配を含む強固で変更のないパートナーシップを再確認しました。
OpenAI
Feb 27, 2026
すべての人々のためのAIの拡大
同社は、AIインフラストラクチャを拡大し、世界的な需要の急増に対応するため、ソフトバンク、NVIDIA、Amazonが支援する1100億ドルの新規投資を発表しました。
Phoronix
Feb 27, 2026
NXPがNeutron NPU向け新しいLinuxアクセラレータドライバを公開
NXPは、同社のNeutron NPUをサポートするための新しいオープンソースLinuxカーネルドライバを公開しました。
Gemini
Feb 27, 2026
Geminiでパーソナライズされた「火の馬の年」の音楽トラックを作成する
Geminiを使用すると、「火の馬の年」の旧正月のために、30秒のパーソナライズされた楽曲とカスタムアートワークを作成できます。
TechCrunch
Feb 26, 2026
Jack Dorsey は Block の従業員数を半減させた — そしてあなたの会社も次だと語る
Jack Dorsey氏が率いるBlock社は、AI活用を理由に、従業員のほぼ半数にあたる4,000人以上を削減しました。
The Verge
Feb 26, 2026
Anthropic、ペンタゴンの新たな条件を拒否し、致死自律型兵器と大量監視に関する姿勢を堅持
Anthropicは、大量監視と自律型兵器に関する倫理的な懸念を優先し、ペンタゴンのAIへの無制限アクセス要求を拒否しました。
CNN
Feb 26, 2026
Anthropic、国防総省の最新の提案を拒否:「良心に従って彼らの要求に応じることはできない」
Anthropicは、AIが大量監視や自律型兵器に使用される懸念から、国防総省の契約変更の申し出を拒否しました。
TechCrunch
Feb 26, 2026
Anthropic CEO、国防総省の期限が迫る中、断固たる姿勢を崩さず
AnthropicのCEO、Dario Amodei氏は、国防総省からの無制限アクセス要求に対し、期限が迫る中で断固として拒否しました。
The Verge
Feb 26, 2026
Microsoft’s Copilot Tasks AI uses its own computer to get things done
Microsoftは、独自のクラウドコンピューターを使用してバックグラウンドで雑用を処理するAIシステム「Copilot Tasks」のプレビューを発表しました。
The Verge
Feb 26, 2026
ジャック・ドーシーのBlock、AI戦略に賭け、従業員のほぼ半数を削減
ジャック・ドーシー率いるBlockは、AIに注力するため、従業員のほぼ半数、4000人以上を削減します。
CapitalAI Daily
Feb 26, 2026
Nvidia CEO Jensen Huang氏、「市場はソフトウェアについて間違っている」と発言 - その理由
Nvidia CEOのJensen Huang氏は、AIエージェントが既存のエンタープライズソフトウェアの利用を減少させるのではなく、増加させると市場が誤解していると考えている。
TechCrunch
Feb 26, 2026
つまり、PradaのMeta AIグラスを手に入れるのですね?
マーク・ザッカーバーグがPradaのショーに出席したことで、Prada Meta AIグラスの発売が憶測されています。
TechCrunch
Feb 26, 2026
Sophia Spaceが革新的な宇宙コンピューターを実証するために1000万ドルのシードラウンドを調達
Sophia Spaceは、革新的なパッシブ冷却宇宙コンピューター技術を2027年か2028年までに軌道上で実証するため、1000万ドルのシード資金を調達しました。
TechCrunch
Feb 26, 2026
Mistral AI がグローバルコンサルティング大手の Accenture と提携契約を締結
Mistral AI と Accenture は、クライアント向けにエンタープライズAI技術を開発するため、複数年にわたる提携契約を締結しました。
TechCrunch
Feb 26, 2026
Read AIがスケジュール管理と回答を支援するメールベースの「デジタルツイン」をローンチ
Read AIは、スケジュール管理と社内知識に関する質問への回答を支援する「デジタルツイン」であるAdaというメールベースのAIアシスタントを立ち上げました。
Gemini
Feb 26, 2026
私の新しい仕事を見つけるのに役立った3つのGoogle AIツール
筆者は、新しい職を得るために、NotebookLM、Career Dreamer、Geminiという3つのGoogle AIツールを活用し、明確さと自信を得ました。
TechCrunch
Feb 26, 2026
BumbleがAIを活用した写真フィードバックとプロフィールガイダンスツールを追加
Bumbleは、プロフィールやプロンプトに関するパーソナライズされたフィードバックを提供するAIツールを世界的に導入し、米国では写真ガイダンスも提供します。
The Verge
Feb 26, 2026
Google’s Nano Banana 2 が無料ユーザーに高度なAI画像ツールを提供
Googleは、より強力なAI画像モデルであるNano Banana 2を無料ユーザー向けにリリースし、以前は有料サブスクリプションでのみ利用可能だった機能を提供します。
Gemini
Feb 26, 2026
Nano Banana 2、最高の画像生成・編集モデルで構築する
Googleは、高忠実度の画像生成とより高速な高度な編集を提供するNano Banana 2(Gemini 3.1 Flash Image)を発表しました。
Gemini
Feb 26, 2026
Nano Banana 2:将 Pro の機能と電光石火のスピードを融合
Google DeepMind は、Pro の機能を Gemini Flash の速度と組み合わせた Nano Banana 2 を発表し、高速で高品質な画像生成を実現しました。
TechCrunch
Feb 26, 2026
Googleがより高速な画像生成を実現するNano Banana 2モデルを発売
Googleは、Gemini 3.1 Flash Imageをベースにした、より高速でリアルな画像生成モデルであるNano Banana 2を発売し、Geminiアプリと検索のデフォルトモデルとします。
9to5Google
Feb 26, 2026
Nano Banana 2 は Pro 品質を Flash スピードで実現し、Gemini アプリに展開中
Google は Gemini アプリに Nano Banana 2 (Gemini 3.1 Flash Image) をリリースし、高速で Pro 品質を提供します。
Inceptionlabs Ai
Feb 26, 2026
Mercury 2 のご紹介 – Inception
Mercury 2 は、拡散ベースの並列洗練を利用して、即時の本番 AI を実現する世界最速の推論 LLM として導入されました。
The Verge
Feb 26, 2026
Anthropic が引退した Claude AI に Substack を提供
Anthropic は、引退した Claude 3 Opus AI モデルを復活させ、「Claude’s Corner」という新しい Substack ニュースレターで週刊の投稿を執筆させています。
TechCrunch
Feb 26, 2026
Figma が OpenAI と提携し、Codex のサポートを組み込む
Figma は OpenAI の AI コーディングツール Codex を統合し、ユーザーがコーディング環境内でデザインを作成および調整できるようにします。
TechCrunch
Feb 26, 2026
TraceがAIエージェントの企業導入問題を解決するため300万ドルを調達
ワークフローオーケストレーションのスタートアップであるTraceは、エンタープライズAIエージェントの導入に必要なコンテキストを提供するために300万ドルのシード資金を調達しました。
The Verge
Feb 26, 2026
Burger King は、従業員が「お願いします」と「ありがとう」と言うかどうかを AI でチェックする
Burger King は、従業員の接客態度、特に丁寧な言葉遣いを評価するために、従業員のヘッドセットに AI チャットボット「Patty」を試験導入しています。
Blocknow: Be ready. Be informed
Feb 26, 2026
マグニフィセント7:AIの設備投資がビッグテックのリーダーをGARPスタイルの株式に変えつつある
巨額のAI設備投資とフリーキャッシュフローの圧力により、マグニフィセント7のバリュエーションプレミアムが縮小し、適正価格での成長(GARP)株に見え始めています。
Salon.com
Feb 26, 2026
Hegseth、Anthropicに対しキラーAIの制限を巡り脅迫
国防長官Hegsethは、Anthropicに対し、AIの安全制限を変更させるために国防生産法を発動すると脅迫しています。
The Verge
Feb 26, 2026
Googleが物理AI追求のため「ロボットのAndroid」プロジェクトの管理を掌握
Googleは、物理AIへの注力を加速するため、独立したロボティクスソフトウェア部門であるIntrinsicを統合します。
The Times of India
Feb 26, 2026
Anthropic CEO Dario Amodei 警告:「AIの津波が来る」、社会は「これから起こること」に対して危険なほど準備不足
AnthropicのCEOであるDario Amodei氏は、「AIの津波」が急速に迫っており、社会はその変化の規模に対して危険なほど準備ができていないと警告しています。
OpenAI
Feb 26, 2026
パシフィックノースウェスト国立研究所とOpenAIが連邦許可の迅速化のために提携
パシフィックノースウェスト国立研究所とOpenAIは、インフラプロジェクトの連邦許可プロセスを迅速化する可能性のあるAIコーディングエージェントの使用を共同で模索しています。
TechCrunch
Feb 26, 2026
Salesforce CEO Marc Benioff:これが我々の最初のSaaSpocalypseではない
Salesforce の CEO Marc Benioff は、現在の AI の脅威を、過去にもあった「SaaSpocalypse」の一つだと位置づけ、投資家を安心させました。
Aisuperhuman Substack
Feb 26, 2026
蒸留戦争:スパイ活動か、効率性か?
Anthropicは、3つの中国AIラボがAPI蒸留を通じて大規模なスパイ活動を行ったと非難したが、文脈は標準的な開発慣行を示唆し、偽善的な懸念を引き起こしている。
TechCrunch
Feb 26, 2026
Gushwork は顧客リード獲得のために AI 検索に賭ける — そして初期の結果が現れ始めている
Gushwork は、ChatGPT などの AI 検索プラットフォームからリードを獲得するため、自動化されたマーケティングエージェントを活用し、900 万ドルのシードラウンドの資金調達を行いました。
TechCrunch
Feb 25, 2026
Anthropicがコンピューター操作AIスタートアップVerceptを買収、Metaが共同創業者の一人を引き抜いた後
Anthropicは、複雑なエージェントタスクのためのツールを開発したAIスタートアップVerceptを買収し、そのチームの一部を取り込みました。
TechCrunch
Feb 25, 2026
Nvidiaは記録的な設備投資支出の中で、さらに記録的な四半期を達成
NvidiaはAIコンピューティング需要の急増により記録的な利益を報告しましたが、中国への輸出収益については依然として不確実性があります。
Forbes
Feb 25, 2026
中国のAIスタートアップがClaudeからデータを採掘している
Anthropicは、3つの中国のAIスタートアップがClaudeからデータを抽出するために不正なアカウントを作成したと非難しました。
TechCrunch
Feb 25, 2026
ホワイトハウスはAI企業に料金値上げの負担を求めている。ほとんどの企業はすでに同意していると表明している。
ホワイトハウスはAI企業にデータセンターによる電気料金の値上げを負担するよう求めているが、主要企業のほとんどはすでに公約している。
The Verge
Feb 25, 2026
トランプ大統領、データセンターに独自の電力供給を負担させると主張
トランプ大統領は、主要なテクノロジー企業にデータセンターの電力供給費用を負担させる方針を表明しました。
TechCrunch
Feb 25, 2026
Alphabet傘下のロボットソフトウェア企業IntrinsicがGoogleに加わる
Alphabet傘下のロボットソフトウェア企業IntrinsicがGoogleに加わり、Googleのインフラを活用して物理AI機能を強化します。
The Verge
Feb 25, 2026
GoogleとSamsungは、AppleがSiriで実現できなかったAI機能を発表した
Googleは、Geminiの新しいエージェントAI機能が間もなくリリースされ、Siriの遅延した機能よりも先に複雑なタスクを処理できると発表しました。
TechCrunch
Feb 25, 2026
ウェアラブルスタートアップCUDISがAI搭載の「コーチ」を備えた新ヘルスリングを発売
ウェアラブルスタートアップのCUDISは、AI搭載の「エージェントコーチ」と健康習慣を促進するポイントシステムを備えた新しいヘルスリングを発表しました。
TechCrunch
Feb 25, 2026
AIインフラに対する国民の反対が激化
高まる公的および立法上の反対により、新しいデータセンターの環境的・経済的影響に関する一時停止措置と政策論争が引き起こされています。
TechCrunch
Feb 25, 2026
Gemini が Android で一部のマルチステップタスクを自動化可能に
Android 上の Gemini AI は、配車やフードデリバリーなどの選択されたマルチステップタスクを自動化できるようになりました。
The Verge
Feb 25, 2026
Geminiが初の自律的(エージェンティック)機能を取得
Geminiは、UberやDoorDashなどのアプリ内で複数ステップのアクションを実行できるタスク自動化機能を取得します。
Gemini
Feb 25, 2026
Gemini に Android 上のマルチステップの日常タスクを処理させましょう。
Gemini は、選択された Android 搭載スマートフォンで、音声コマンドによるマルチステップの日常タスクを自動化するベータ機能を間もなくリリースします。
Gemini
Feb 25, 2026
Samsung Galaxy S26でのよりインテリジェントなAndroid
SamsungとGoogleは、タスクの委任、画像検索、通話詐欺検出を強化するため、Galaxy S26シリーズでGeminiを搭載した新しいAI機能を発売します。
TechCrunch
Feb 25, 2026
OpenAIのCOO、広告は「反復的なプロセス」になると発言
OpenAIのCOOは、ChatGPTへの広告導入はユーザーの信頼とプライバシーを維持することに焦点を当てた反復的なプロセスになると述べました。
Fortune
Feb 25, 2026
ティーンの半数以上が学校の課題にAIを利用しているが、多くの親はそれを知らない | Fortune
ピュー研究所の調査によると、米国のティーンの57%が情報検索に、54%が学業にAIを利用しており、多くの保護者はその事実を知りません。
TechCrunch
Feb 25, 2026
OpenClaw制作者からのAIビルダーへのアドバイスは、もっと遊び心を持ち、改善のための時間を自分に与えること
OpenClawの制作者であるPeter Steinbergerは、AIビルダーに対し、探求心を持ち、遊び心を忘れず、AIを使いこなすスキル向上のための時間を確保するよう助言しています。
TechCrunch
Feb 25, 2026
米国ティーンエイジャーの約12%が感情的なサポートやアドバイスをAIに求めている
ピュー・リサーチ・センターの報告によると、米国ティーンエイジャーの12%が感情的なサポートのためにAIチャットボットを利用しており、専門家は懸念を示しています。
The Verge
Feb 25, 2026
AmazonのAGIラボリーダーが退社
AmazonのサンフランシスコAIラボ責任者であるDavid Luanが、AIに新しい能力を教えることに専念するため退社します。
TechCrunch
Feb 25, 2026
米国、外交官に外国のデータ主権法に反対するよう指示
トランプ政権は、AIサービスとデータフローを脅かすとして、外交官に外国のデータ主権法に反対するよう指示しました。
The Verge
Feb 25, 2026
Anthropic は Claude が生きていると考えているか?「生きている」を定義する
Anthropic の幹部は Claude が意識を持っている可能性を示唆していますが、同社は生物学的な意味での「生きている」とは否定しています。
TechCrunch
Feb 25, 2026
Adobe Fireflyのビデオエディターが、映像から自動的に最初のドラフトを作成できるようになりました
Adobe Fireflyの新しいQuick Cut機能は、AIを使用して、ユーザーのプロンプトに基づいて映像とBロールから自動的にビデオの最初のドラフトを作成します。
The Verge
Feb 25, 2026
Alexa の AI の個性を、よりフレンドリー、率直、またはリラックスしたものに変更できるようになりました
Amazon は Alexa Plus ユーザー向けに、簡潔、リラックス、スイートの 3 つの新しいパーソナリティ スタイルを導入しました。
The Verge
Feb 25, 2026
Adobeの新しいAI動画編集ツールがクリップをつなぎ合わせて初稿を作成
Adobeは、テキストプロンプトに基づいて動画クリップを自動的に組み立てて初稿を作成する、新しいFirefly機能「Quick Cut」をベータ版でリリースしました。
TechCrunch
Feb 25, 2026
AmazonのAI搭載Alexa+に新しいパーソナリティオプションが登場
Amazonは、AIアシスタントAlexa+のトーンを変更する「Brief」「Chill」「Sweet」の3つの新しいパーソナリティスタイルを導入しました。
TechCrunch
Feb 25, 2026
Jiraの最新アップデートにより、AIエージェントと人間が並行して作業できるようになりました
AtlassianのJiraアップデートにより、チームはAIエージェントと人間の従業員を統合されたダッシュボードで管理し、生産性向上を目指すことができます。
TechCrunch
Feb 25, 2026
Khosla’s Keith Rabois が Comp を支援、AIで人事チームを強化へ
ブラジルに特化したHRテックのスタートアップCompが、AIを活用して人事チームを強化するため、Khosla Ventures主導の1725万ドルのシリーズAラウンドを調達しました。
ニュースをもっと見る
Best LLMs and AI Chatbots
Data Source:
Artificial Analysis
Rank
Model
Score
1
Gemini 3.1 Pro Preview
(Google)
57.2
2
GPT-5.3 Codex (xhigh)
(OpenAI)
54.0
3
Claude Opus 4.6 (Adaptive Reasoning, Max Effort)
(Anthropic)
53.0
4
Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)
(Anthropic)
51.7
5
GPT-5.2 (xhigh)
(OpenAI)
51.3
6
GLM-5 (Reasoning)
(Z AI)
49.8
7
Claude Opus 4.5 (Reasoning)
(Anthropic)
49.7
8
GPT-5.2 Codex (xhigh)
(OpenAI)
49.0
9
Gemini 3 Pro Preview (high)
(Google)
48.4
10
GPT-5.1 (high)
(OpenAI)
47.7
11
Kimi K2.5 (Reasoning)
(Kimi)
46.8
12
GPT-5.2 (medium)
(OpenAI)
46.6
13
Claude Opus 4.6 (Non-reasoning, High Effort)
(Anthropic)
46.5
14
Gemini 3 Flash Preview (Reasoning)
(Google)
46.4
15
Qwen3.5 397B A17B (Reasoning)
(Alibaba)
45.0
16
GPT-5 Codex (high)
(OpenAI)
44.6
17
GPT-5 (high)
(OpenAI)
44.6
18
Claude Sonnet 4.6 (Non-reasoning, High Effort)
(Anthropic)
44.4
19
GPT-5.1 Codex (high)
(OpenAI)
43.1
20
Claude Opus 4.5 (Non-reasoning)
(Anthropic)
43.1
21
Claude 4.5 Sonnet (Reasoning)
(Anthropic)
43.0
22
Claude Sonnet 4.6 (Non-reasoning, Low Effort)
(Anthropic)
42.6
23
Qwen3.5 27B (Reasoning)
(Alibaba)
42.1
24
GLM-4.7 (Reasoning)
(Z AI)
42.1
25
GPT-5 (medium)
(OpenAI)
42.0
26
MiniMax-M2.5
(MiniMax)
41.9
27
DeepSeek V3.2 (Reasoning)
(DeepSeek)
41.7
28
Qwen3.5 122B A10B (Reasoning)
(Alibaba)
41.6
29
Grok 4
(xAI)
41.5
30
MiMo-V2-Flash (Feb 2026)
(Xiaomi)
41.5
31
Gemini 3 Pro Preview (low)
(Google)
41.3
32
GPT-5 mini (high)
(OpenAI)
41.2
33
Kimi K2 Thinking
(Kimi)
40.9
34
o3-pro
(OpenAI)
40.7
35
GLM-5 (Non-reasoning)
(Z AI)
40.6
36
Qwen3.5 397B A17B (Non-reasoning)
(Alibaba)
40.1
37
Qwen3 Max Thinking
(Alibaba)
39.9
38
MiniMax-M2.1
(MiniMax)
39.4
39
GPT-5 (low)
(OpenAI)
39.2
40
MiMo-V2-Flash (Reasoning)
(Xiaomi)
39.2
41
GPT-5 mini (medium)
(OpenAI)
38.9
42
Claude 4 Sonnet (Reasoning)
(Anthropic)
38.7
43
GPT-5.1 Codex mini (high)
(OpenAI)
38.6
44
Grok 4.1 Fast (Reasoning)
(xAI)
38.6
45
o3
(OpenAI)
38.4
46
Kimi K2.5 (Non-reasoning)
(Kimi)
37.3
47
Claude 4.5 Haiku (Reasoning)
(Anthropic)
37.1
48
Qwen3.5 35B A3B (Reasoning)
(Alibaba)
37.1
49
Claude 4.5 Sonnet (Non-reasoning)
(Anthropic)
37.1
50
MiniMax-M2
(MiniMax)
36.1
51
KAT-Coder-Pro V1
(KwaiKAT)
36.0
52
Nova 2.0 Pro Preview (medium)
(Amazon)
35.7
53
Grok 4 Fast (Reasoning)
(xAI)
35.1
54
Gemini 3 Flash Preview (Non-reasoning)
(Google)
35.0
55
Claude 3.7 Sonnet (Reasoning)
(Anthropic)
34.7
56
Gemini 2.5 Pro
(Google)
34.6
57
GLM-4.7 (Non-reasoning)
(Z AI)
34.2
58
DeepSeek V3.2 Speciale
(DeepSeek)
34.1
59
DeepSeek V3.1 Terminus (Reasoning)
(DeepSeek)
33.9
60
GPT-5.2 (Non-reasoning)
(OpenAI)
33.6
61
Doubao Seed Code
(ByteDance Seed)
33.5
62
gpt-oss-120B (high)
(OpenAI)
33.3
63
o4-mini (high)
(OpenAI)
33.1
64
Claude 4 Sonnet (Non-reasoning)
(Anthropic)
33.0
65
DeepSeek V3.2 Exp (Reasoning)
(DeepSeek)
32.9
66
Mercury 2
(Inception)
32.8
67
Qwen3 Max Thinking (Preview)
(Alibaba)
32.5
68
GLM-4.6 (Reasoning)
(Z AI)
32.5
69
DeepSeek V3.2 (Non-reasoning)
(DeepSeek)
32.1
70
Grok 3 mini Reasoning (high)
(xAI)
32.1
71
K-EXAONE (Reasoning)
(LG AI Research)
32.1
72
Nova 2.0 Pro Preview (low)
(Amazon)
31.9
73
Claude 4.1 Opus (Reasoning)
(Anthropic)
31.9
74
Qwen3 Max
(Alibaba)
31.4
75
Claude 4.5 Haiku (Non-reasoning)
(Anthropic)
31.1
76
Gemini 2.5 Flash Preview (Sep '25) (Reasoning)
(Google)
31.1
77
Kimi K2 0905
(Kimi)
30.9
78
o1
(OpenAI)
30.8
79
Claude 3.7 Sonnet (Non-reasoning)
(Anthropic)
30.8
80
MiMo-V2-Flash (Non-reasoning)
(Xiaomi)
30.4
81
Gemini 2.5 Pro Preview (Mar' 25)
(Google)
30.3
82
GLM-4.6 (Non-reasoning)
(Z AI)
30.2
83
GLM-4.7-Flash (Reasoning)
(Z AI)
30.1
84
Nova 2.0 Lite (medium)
(Amazon)
29.7
85
Qwen3 235B A22B 2507 (Reasoning)
(Alibaba)
29.5
86
Gemini 2.5 Pro Preview (May' 25)
(Google)
29.5
87
ERNIE 5.0 Thinking Preview
(Baidu)
29.1
88
Grok Code Fast 1
(xAI)
28.7
89
DeepSeek V3.1 Terminus (Non-reasoning)
(DeepSeek)
28.5
90
DeepSeek V3.2 Exp (Non-reasoning)
(DeepSeek)
28.4
91
Qwen3 Coder Next
(Alibaba)
28.3
92
Apriel-v1.5-15B-Thinker
(ServiceNow)
28.3
93
DeepSeek V3.1 (Non-reasoning)
(DeepSeek)
28.1
94
Nova 2.0 Omni (medium)
(Amazon)
28.0
95
DeepSeek V3.1 (Reasoning)
(DeepSeek)
27.7
96
Apriel-v1.6-15B-Thinker
(ServiceNow)
27.6
97
Qwen3 VL 235B A22B (Reasoning)
(Alibaba)
27.6
98
GPT-5.1 (Non-reasoning)
(OpenAI)
27.4
99
Claude 4 Opus (Reasoning)
(Anthropic)
27.4
100
Magistral Medium 1.2
(Mistral)
27.1