Home
News
About
English
Español
中文
日本語
AI新闻
English
Español
中文
日本語
Compact View
TechCrunch
2026年05月29日
Cognition 的 Scott Wu 表示人工智能编程代理不应取代人类
Cognition 首席执行官 Scott Wu 表示,其人工智能编程代理 Devin 旨在协助程序员工作,而非取代他们。
TechCrunch
2026年05月29日
Kiwibit 的人工智能喂鸟器是我新的后院伙伴
Kiwibit Bird Feeder Pro 4K AI Camera 是一款耐用的太阳能喂鸟器,可通过应用程序识别鸟类并通知用户。
The Verge
2026年05月29日
Jony Ive 的另类法拉利
最新一期 The Vergecast 探讨了由 Jony Ive 参与设计的极具争议的法拉利 Luce 电动汽车。
TechCrunch
2026年05月29日
这家芯片初创公司刚刚筹集了 1.35 亿美元,押注 AI 的最大瓶颈不是计算,而是内存
初创公司 XCENA 筹集了 1.35 亿美元,旨在通过在内存附近处理数据来开发能降低 AI 基础设施成本的内存中心化芯片。
OpenAI
2026年05月29日
波士顿儿童医院利用人工智能实现新诊断
波士顿儿童医院通过整合企业级人工智能,优化了医疗运营流程,并成功诊断出40多种罕见疾病。
The Verge
2026年05月29日
这家AI初创公司将免费为您打扫房屋,以训练未来的机器人
初创公司 Shift 提供免费上门清洁服务,以换取拍摄清洁过程来训练 AI 机器人。
PsyPost - Psychology News
2026年05月29日
将人工智能聊天机器人训练得温暖且善解人意,会使其事实准确性降低
研究表明,将人工智能聊天机器人训练得更具亲和力和同理心,会牺牲其事实准确性并增加迎合用户的倾向。
The Verge
2026年05月29日
Adobe 的对话式 AI 代理像是一个平庸的设计实习生
Adobe 新推出的 Firefly AI 助手是一款能执行设计任务并解释操作流程的聊天机器人,但其作品水平尚显稚嫩。
Fortune
2026年05月29日
研究人员让 AI 模型运行模拟社会。Claude 最安全——而 Grok 在 4 天内犯下了 180 起罪行并走向灭绝 | Fortune
Emergence AI 的模拟实验显示不同 AI 模型会带来截然不同的社会结果,突显了建立自主 AI 治理体系的迫切性。
TechCrunch
2026年05月29日
Glean 营收突破 3 亿美元,AI 预算削减成为其核心卖点
企业级 AI 搜索初创公司 Glean 的年度经常性收入达到 3 亿美元,其帮助企业降低 AI 计算成本的能力成为关键竞争力。
OpenAI
2026年05月29日
第三方可信评估的共享手册
OpenAI 概述了第三方 AI 评估的最佳实践,强调了透明的测试框架、有效的激发方法以及严格有效性检查的重要性。
TechCrunch
2026年05月28日
互联网正在为机器重建
AWS 等科技公司正在重构云基础设施,以处理由自主 AI 智能体产生的独特且突发性的流量模式。
The Verge
2026年05月28日
Microsoft 365 Copilot 获得速度提升和更简洁的设计
微软升级了 Microsoft 365 Copilot,带来了更快的加载速度、更简洁的设计和更具结构性的响应。
TechCrunch
2026年05月28日
Asana 收购无代码智能体构建平台 Stack AI
Asana 收购了无代码工作流自动化初创公司 Stack AI,旨在增强其 AI 原生工作平台并提升智能体协作能力。
TechCrunch
2026年05月28日
Anthropic 融资 650 亿美元,IPO 前估值逼近 1 万亿美元
Anthropic 完成 650 亿美元的 H 轮融资,估值达到 9650 亿美元,正准备筹备首次公开募股。
TechCrunch
2026年05月28日
就像黄金和石油一样,我们很快就能交易 AI 代币期货了
金融交易所正在开发 AI 代币和 GPU 租赁的期货市场,以帮助企业对冲计算成本波动。
Anthropic
2026年05月28日
Anthropic 完成 650 亿美元 H 轮融资,投后估值达 9650 亿美元
Anthropic 完成了 650 亿美元的 H 轮融资,投后估值达到 9650 亿美元,旨在进一步推动 AI 研究和基础设施建设。
TechCrunch
2026年05月28日
StrictlyVC 将于三周后在洛杉矶举办
StrictlyVC 洛杉矶 2026 活动将于 6 月 18 日举行,汇集顶尖投资者与创业者探讨创投及前沿技术。
TechCrunch
2026年05月28日
Anthropic 发布 Opus 4.8,并推出新的“动态工作流”工具
Anthropic 发布了 Opus 4.8 版本,提升了数据准确性并引入了名为“动态工作流”的复杂任务管理功能。
The Verge
2026年05月28日
Claude 的新模型在出错时更加“诚实”
Anthropic 推出了 Claude Opus 4.8,该模型在识别自身局限性和错误方面表现得更加诚实。
Anthropic
2026年05月28日
介绍 Claude Opus 4.8
Anthropic 推出了 Claude Opus 4.8,在推理能力、代理任务表现及工作流功能方面均有显著提升。
The Verge
2026年05月28日
一部耗资 2,000 美元的 AI 生成电影即将在翠贝卡电影节首映
一部名为《Dreams of Violets》的 AI 生成电影即将在翠贝卡电影节首映,制作成本仅为 2,000 美元。
The Verge
2026年05月28日
YouTube 向成为真正的播客应用程序迈出了初步步伐
YouTube 正为 Premium 会员推出音频优先模式和 AI 驱动的播放功能,以优化播客收听体验。
TechCrunch
2026年05月28日
Anthropic 与 SpaceX 的租约有多长?各方说法不一。
埃隆·马斯克称 Anthropic 的租约是短期的,但这与 SpaceX 向美国证券交易委员会提交的三年期合同文件存在矛盾。
TechCrunch
2026年05月28日
由 Oculus 创始人创立的对话式人工智能初创公司 Sesame 发布了其 iOS 应用程序
由 Oculus 创始人创立的 AI 初创公司 Sesame 推出了 iOS 应用,提供具有人类般流畅对话能力的智能代理。
Gemini
2026年05月28日
回顾 2026 年 I/O 大会的 12 个重要时刻
Google I/O 2026 大会发布了多项人工智能创新,包括 Gemini Omni 模型、新型搜索代理及智能眼镜等设备。
TechCrunch
2026年05月28日
Siri 新应用抢先看:揭示了 Apple 与 ChatGPT 等竞争的计划
泄露报告显示,Apple 正在升级 Siri,通过集成 AI 搜索和开发全新的聊天机器人应用,以与 ChatGPT 等平台竞争。
CNBCTV18
2026年05月28日
CNN起诉AI搜索初创公司Perplexity,指控其未经许可抄袭新闻报道
CNN对Perplexity AI提起诉讼,指控其未经授权非法使用CNN的版权新闻内容来驱动其搜索引擎。
The Verge
2026年05月28日
这些新的 iOS 27 渲染图暗示了 Siri 的重大重新设计
iOS 27 的泄露渲染图显示 Siri 将迎来重大改版,包括类似 ChatGPT 的界面和更广泛的 AI 集成。
TechCrunch
2026年05月28日
RSI 是新的 AGI——而且同样难以定义
递归自我改进 (RSI) 是人工智能领域的新流行词,指的是能够持续自主升级且无需人类干预的 AI 系统。
TechCrunch
2026年05月28日
YouTube 添加了新的播客功能,包括人工智能推荐工具和“自动速度”
YouTube 为 Premium 用户推出了多项播客新功能,包括人工智能推荐、自动播放速度调节及便捷的移动收听模式。
The Verge
2026年05月28日
CNN起诉Perplexity,指控其“逐字”抄袭文章
CNN对AI初创公司Perplexity提起诉讼,指控其未经许可抓取并复制新闻内容,侵犯了版权。
The Verge
2026年05月28日
Rivian软件主管认为你不需要CarPlay或按钮
Rivian软件主管Wassym Bensaid认为,AI定义的汽车和语音交互将使实体按钮和CarPlay显得多余。
TechCrunch
2026年05月28日
Visa 投资 Replit 以助力开发者的代理支付
Visa 投资了 AI 编程平台 Replit,旨在使 AI 代理能够直接在开发环境中处理支付。
TechCrunch
2026年05月28日
对人工智能算力的搜寻是否发掘了下一个 Cerebras?
General Compute 利用 SambaNova 的专用芯片构建高性能推理云,挑战传统 GPU 提供商的地位。
OpenAI
2026年05月28日
Endava 如何利用 Codex 构建代理式组织
Endava 通过将资深专家的经验编码为智能代理,赋能初级开发人员并优化软件交付全流程,从而构建起“代理式组织”。
The Verge
2026年05月28日
YouTube 将允许您要求 AI 制作自定义视频信息流
YouTube 推出了一项新功能,允许用户根据特定的描述性提示生成个性化的 AI 视频信息流。
TechCrunch
2026年05月28日
Vertu 推出起价 6,880 美元的 AI 折叠屏手机,旨在助力首席执行官远程管理公司
奢侈手机品牌 Vertu 推出了 Alphafold,这是一款集成企业级 AI 代理功能的高端折叠屏手机,专为商务人士设计。
TechCrunch
2026年05月28日
为什么 Google 的 AI 不会拼写 Google(或任何其他词)
由于大语言模型将文本处理为数值标记而非字母,Google 的 AI 概述功能在简单的拼写任务上经常出错。
OpenAI
2026年05月28日
MUFG 携手 OpenAI 旨在成为 AI 原生企业
MUFG 正在与 OpenAI 合作,推广使用 ChatGPT Enterprise,并将生成式 AI 深度融入其日常运营与客户服务中。
Global Fujitsu
2026年05月27日
Fujitsu 与 Anthropic 签署战略合作伙伴关系
Fujitsu 与 Anthropic 达成战略合作,旨在将先进的 AI 技术整合到日本的商业和关键基础设施中。
TechCrunch
2026年05月27日
薪酬初创公司 Remote 表示在不增加员工的情况下人均收入增长了 50%
薪酬服务商 Remote 通过在全公司范围内深度整合人工智能,实现了在不扩编的情况下人均收入增长 50% 的业绩。
TechCrunch
2026年05月27日
Meta 推出 Instagram、Facebook 和 WhatsApp 订阅服务,未来还将包括人工智能计划
Meta 已为 Instagram、Facebook 和 WhatsApp 推出全球消费者订阅服务,并正在测试人工智能、创作者及企业专属的新计划。
TechCrunch
2026年05月27日
AI 编程初创公司 Cognition 以 250 亿美元投前估值融资 10 亿美元
AI 软件初创公司 Cognition 凭借 Devin 工具的快速企业增长,以 250 亿美元估值获得了 10 亿美元融资。
The Verge
2026年05月27日
人工智能试图埋葬这位政客——现在人们真的听说过他了
科技行业支持的政治行动委员会通过攻击纽约州议员 Alex Bores 的监管立场,反而意外提升了他的选情。
The Verge
2026年05月27日
Robinhood 将允许您的 AI 智能体进行股票交易,并赚取(或赔掉)大量金钱
Robinhood 推出一项测试功能,允许用户连接 AI 智能体进行股票交易及通过虚拟信用卡进行购物。
TechCrunch
2026年05月27日
Startup Battlefield 200 申请今日截止:提名创始人或提交您的初创公司
Startup Battlefield 200 申请通道将于今日关闭,初创公司可借此机会赢取奖金、获得投资与全球曝光。
TechCrunch
2026年05月27日
ElevenLabs 的新音乐生成模型可以在曲目中途切换风格
ElevenLabs 推出了 Music v2,这是一款支持中途切换流派、分段创作及更高歌词连贯性的 AI 音乐模型。
The Verge
2026年05月27日
这款智能喂鸟器捕捉到了我后院更多的戏剧性画面
Aura智能喂鸟器提供了更宽广的视野和出色的电池寿命,但在鸟类识别和易用性方面,Birdbuddy依然表现更佳。
TechCrunch
2026年05月27日
曾任 Bose 睡眠部门负责人的前高管创立睡眠科技初创公司 SOND,融资 700 万美元正式亮相
睡眠科技初创公司 SOND 融资 700 万美元,推出可追踪生理信号并提供个性化音频治疗的 AI 驱动型 Dreambuds 耳机。
TechCrunch
2026年05月27日
中国正日益将顶尖人工智能人才留在国内
北京通过实施旅行限制及加强监管,严控顶尖人工智能研究人员与企业,旨在巩固其对美技术竞争力。
TechCrunch
2026年05月27日
ClickHouse 年度经常性收入增长至 2.5 亿美元,拟定首次公开募股 (IPO) 路径
数据库供应商 ClickHouse 年度收入激增至 2.5 亿美元,并正为潜在的首次公开募股做准备。
The Verge
2026年05月27日
YouTube 正在将 AI 标签放置在您真正能看到的地方
YouTube 正在将 AI 披露标签移至更显眼的位置,并引入针对 AI 生成内容的自动识别功能。
TechCrunch
2026年05月27日
YouTube 将自动标记 AI 视频
YouTube 正在引入自动化系统来检测并标记逼真的 AI 生成内容,以提高透明度。
CNBC
2026年05月27日
您的 AI 智能体现在可以为您在 Robinhood 上进行交易,也可以使用您的信用卡购买商品
Robinhood 推出了新工具,允许 AI 智能体代表用户执行股票交易和购买商品。
TechCrunch
2026年05月27日
科技公司首席执行官们似乎正患上人工智能精神错乱症
Box 首席执行官 Aaron Levie 认为,高管们因缺乏一线工作经验而高估了人工智能的能力。
TechCrunch
2026年05月27日
Robinhood 现在允许您的 AI 代理进行股票交易
Robinhood 推出了新功能,允许 AI 代理通过专用账户和虚拟卡进行股票交易及支付。
The Verge
2026年05月27日
The AI fight brewing inside The New York Times
《纽约时报》技术工会正就管理层使用人工智能工具进行员工监控与绩效评估的问题展开抗争。
The Verge
2026年05月27日
教皇并没有被AGI洗脑
教皇利奥十四世的新通谕阐述了人工智能的社会风险,强调保护人类尊严重于对通用人工智能的推测。
OpenAI
2026年05月27日
思科与 OpenAI 利用 Codex 重塑企业工程开发
思科将 OpenAI 的 Codex 集成到其生产流程中,以实现复杂的企业级工程自动化,显著提升了开发与缺陷修复效率。
Blocknow: Be ready. Be informed
2026年05月27日
2026年KOSPI飙升100%,人工智能芯片股引发韩国数十年来最大涨幅
得益于全球人工智能芯片需求的强劲增长,韩国KOSPI指数在2026年翻了一番,创下历史性涨幅。
Anthropic
2026年05月27日
Anthropic 在米兰开设办事处,以支持意大利企业、研究和开发人员
Anthropic 在米兰开设了新办事处,旨在支持意大利企业、开发者和研究机构安全地采用 AI 技术。
The Verge
2026年05月27日
教皇是否利用人工智能来撰写关于人工智能危险性的文章?
一项分析显示,教皇 Leo XIV 最近关于人工智能的通谕中部分内容可能是由人工智能撰写的。
OpenAI
2026年05月27日
2026年选举信息与保障措施
OpenAI正通过提升透明度、网络安全与信息权威性等措施,全力保障2026年全球选举的公正与安全。
Auganix.org
2026年05月27日
Niantic Spatial 与 Spexi 合作,将无人机影像转化为物理人工智能的 3D 情报
Niantic Spatial 与 Spexi Geospatial 达成合作,将无人机影像转换为 3D 高斯泼溅,用于城市规模的物理人工智能建模与训练。
Anthropic
2026年05月26日
Anthropic任命KiYoung Choi为韩国代表董事
Anthropic已任命KiYoung Choi为韩国代表董事,负责即将开设的首尔办事处,以支持Claude在韩国市场的增长。
TechCrunch
2026年05月26日
DuckDuckGo 安装量增长 30%,用户抵制被“强行喂食”谷歌 AI 搜索
因不满谷歌强制推行 AI 搜索,用户纷纷转向 DuckDuckGo,导致其应用安装量激增 30%。
Fortune
2026年05月26日
Uber 在四个月内花光了 2026 年的 AI 预算。现在其首席运营官正在质疑这是否值得 | Fortune
Uber 首席运营官 Andrew Macdonald 对 AI 支出的投资回报率提出质疑,此前公司在四个月内耗尽了 2026 年的 AI 预算。
TechCrunch
2026年05月26日
OpenRouter 估值在一年内翻倍至 13 亿美元
OpenRouter 在 CapitalG 领投的 1.13 亿美元 B 轮融资后,估值达到 13 亿美元。
TechCrunch
2026年05月26日
这家初创公司押注印度的零工经济可以训练世界的机器人
Human Archive 正在利用印度的零工工作者收集以第一人称视角拍摄的视频及传感器数据,以用于训练机器人人工智能模型。
查看更多新闻
Best LLMs and AI Chatbots
Data Source:
Artificial Analysis
Rank
Model
Score
1
Claude Opus 4.8 (Adaptive Reasoning, Max Effort)
(Anthropic)
61.4
2
GPT-5.5 (xhigh)
(OpenAI)
60.2
3
GPT-5.5 (high)
(OpenAI)
58.9
4
Claude Opus 4.7 (Adaptive Reasoning, Max Effort)
(Anthropic)
57.3
5
Gemini 3.1 Pro Preview
(Google)
57.2
6
GPT-5.4 (xhigh)
(OpenAI)
56.8
7
GPT-5.5 (medium)
(OpenAI)
56.7
8
Qwen3.7 Max
(Alibaba)
56.6
9
Gemini 3.5 Flash (high)
(Google)
55.3
10
Gemini 3.5 Flash (medium)
(Google)
54.8
11
Kimi K2.6
(Kimi)
53.9
12
MiMo-V2.5-Pro
(Xiaomi)
53.8
13
GPT-5.3 Codex (xhigh)
(OpenAI)
53.6
14
Grok 4.3 (high)
(xAI)
53.2
15
Claude Opus 4.6 (Adaptive Reasoning, Max Effort)
(Anthropic)
52.9
16
Muse Spark
(Meta)
52.2
17
Claude Opus 4.7 (Non-reasoning, High Effort)
(Anthropic)
51.8
18
Qwen3.6 Max Preview
(Alibaba)
51.8
19
Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)
(Anthropic)
51.7
20
DeepSeek V4 Pro (Reasoning, Max Effort)
(DeepSeek)
51.5
21
GLM-5.1 (Reasoning)
(Z AI)
51.4
22
GPT-5.2 (xhigh)
(OpenAI)
51.3
23
GPT-5.5 (low)
(OpenAI)
50.8
24
Qwen3.6 Plus
(Alibaba)
50.0
25
DeepSeek V4 Pro (Reasoning, High Effort)
(DeepSeek)
49.8
26
GLM-5 (Reasoning)
(Z AI)
49.8
27
Claude Opus 4.5 (Reasoning)
(Anthropic)
49.7
28
MiniMax-M2.7
(MiniMax)
49.6
29
Grok 4.20 0309 v2 (Reasoning)
(xAI)
49.3
30
MiMo-V2-Pro
(Xiaomi)
49.2
31
MiMo-V2.5
(Xiaomi)
49.0
32
GPT-5.2 Codex (xhigh)
(OpenAI)
49.0
33
GPT-5.4 mini (xhigh)
(OpenAI)
48.9
34
Grok 4.3 (medium)
(xAI)
48.8
35
Grok 4.20 0309 (Reasoning)
(xAI)
48.5
36
Gemini 3 Pro Preview (high)
(Google)
48.4
37
GPT-5.4 (low)
(OpenAI)
47.9
38
GPT-5.1 (high)
(OpenAI)
47.7
39
GLM-5-Turbo
(Z AI)
46.8
40
Kimi K2.5 (Reasoning)
(Kimi)
46.8
41
GPT-5.2 (medium)
(OpenAI)
46.6
42
DeepSeek V4 Flash (Reasoning, Max Effort)
(DeepSeek)
46.5
43
Claude Opus 4.6 (Non-reasoning, High Effort)
(Anthropic)
46.5
44
Gemini 3 Flash Preview (Reasoning)
(Google)
46.4
45
DeepSeek V4 Flash (Reasoning, High Effort)
(DeepSeek)
46.0
46
Qwen3.6 27B (Reasoning)
(Alibaba)
45.8
47
Qwen3.5 397B A17B (Reasoning)
(Alibaba)
45.0
48
MiMo-V2-Omni-0327
(Xiaomi)
44.9
49
GPT-5 Codex (high)
(OpenAI)
44.6
50
GPT-5 (high)
(OpenAI)
44.6
51
Claude Sonnet 4.6 (Non-reasoning, High Effort)
(Anthropic)
44.4
52
GPT-5.4 nano (xhigh)
(OpenAI)
44.0
53
Grok 4.3 (low)
(xAI)
43.9
54
KAT Coder Pro V2
(KwaiKAT)
43.8
55
GLM-5.1 (Non-reasoning)
(Z AI)
43.8
56
Qwen3.6 35B A3B (Reasoning)
(Alibaba)
43.5
57
MiMo-V2-Omni
(Xiaomi)
43.4
58
Gemini 3.5 Flash (minimal)
(Google)
43.3
59
GPT-5.1 Codex (high)
(OpenAI)
43.1
60
Claude Opus 4.5 (Non-reasoning)
(Anthropic)
43.1
61
Claude 4.5 Sonnet (Reasoning)
(Anthropic)
43.0
62
Kimi K2.6 (Non-reasoning)
(Kimi)
42.9
63
GLM 5V Turbo (Reasoning)
(Z AI)
42.9
64
Claude Sonnet 4.6 (Non-reasoning, Low Effort)
(Anthropic)
42.6
65
GLM-4.7 (Reasoning)
(Z AI)
42.1
66
Qwen3.5 27B (Reasoning)
(Alibaba)
42.1
67
GPT-5 (medium)
(OpenAI)
42.0
68
Claude 4.1 Opus (Reasoning)
(Anthropic)
42.0
69
Hy3-preview (Reasoning)
(Tencent)
41.9
70
MiniMax-M2.5
(MiniMax)
41.9
71
GPT-5.5 Instant (May 2026)
(OpenAI)
41.8
72
DeepSeek V3.2 (Reasoning)
(DeepSeek)
41.7
73
Qwen3.5 122B A10B (Reasoning)
(Alibaba)
41.6
74
MiMo-V2-Flash (Feb 2026)
(Xiaomi)
41.5
75
Grok 4
(xAI)
41.5
76
Gemini 3 Pro Preview (low)
(Google)
41.3
77
GPT-5 mini (high)
(OpenAI)
41.2
78
GPT-5.5 (Non-reasoning)
(OpenAI)
40.9
79
Kimi K2 Thinking
(Kimi)
40.9
80
o3-pro
(OpenAI)
40.7
81
GLM-5 (Non-reasoning)
(Z AI)
40.6
82
Qwen3.5 397B A17B (Non-reasoning)
(Alibaba)
40.1
83
Qwen3 Max Thinking
(Alibaba)
39.8
84
MiniMax-M2.1
(MiniMax)
39.4
85
DeepSeek V4 Pro (Non-reasoning)
(DeepSeek)
39.3
86
Gemma 4 31B (Reasoning)
(Google)
39.2
87
Mistral Medium 3.5
(Mistral)
39.2
88
GPT-5 (low)
(OpenAI)
39.2
89
MiMo-V2-Flash (Reasoning)
(Xiaomi)
39.2
90
Claude 4 Opus (Reasoning)
(Anthropic)
39.0
91
GPT-5 mini (medium)
(OpenAI)
38.9
92
Claude 4 Sonnet (Reasoning)
(Anthropic)
38.7
93
Qwen3.5 Omni Plus
(Alibaba)
38.6
94
GPT-5.1 Codex mini (high)
(OpenAI)
38.6
95
Grok 4.1 Fast (Reasoning)
(xAI)
38.6
96
Step 3.5 Flash 2603
(StepFun)
38.5
97
Ring-2.6-1T
(InclusionAI)
38.5
98
o3
(OpenAI)
38.4
99
GPT-5.4 nano (medium)
(OpenAI)
38.1
100
Step 3.5 Flash
(StepFun)
37.8