人工智能代理是否已为工作场所做好准备？一项新的基准测试引发了人们的质疑。 - 币界网

登录

手机号码

+86

验证码

获取验证码

密码

密码登录

忘记密码？

登录

未注册的手机号验证通过后将自动注册

我已阅读并同意用户协议和隐私政策

取消

选择语言

确认

简体中文

繁体中文

English

首页

行情

快讯

工具

专题

更多

特约

原创

汇率

数据

加密货币对

文章

问答

百科

人物

交易所

钱包

导航

关于我们

联系我们

免责声明

正在加载

人工智能代理是否已为工作场所做好准备？一项新的基准测试引发了人们的质疑。

2026-01-23 05:50:23

币界网报道：来自训练数据公司Mercor的一项最新基准测试表明，人工智能模型在应对现实世界中的白领工作任务时仍然面临挑战。这项名为Apex-Agents的测试基于咨询、银行和法律等行业的实际工作数据，结果显示，即使是Gemini 3 Flash和GPT-5.2这样的顶级模型，在大多数查询中也表现不佳，准确率低于25%。关键挑战在于多领域信息检索，而这正是人类的核心技能。研究人员注意到人工智能技术正在快速进步，但最终得出结论：人工智能尚未做好取代专业人士的准备。

最新快讯

专家解释为何市值理论不适用于 XRP

2026-01-23 07:13

比特币巨头战略为何可能在其140亿美元的财务保护层中出现裂痕

2026-01-23 07:09

为什么 X 公司押注比特币的声音能够解决其新用户问题

2026-01-23 07:09

特朗普关税威胁远超实际实施

2026-01-23 07:08

贝莱德CIO接任美联储主席概率创新高

2026-01-23 07:06

CMP Mining宣布关联方本票

2026-01-23 06:57

黄金价格突破 4900 美元，加密货币市场密切关注恐慌性交易——以下是此次创纪录涨幅所传递的信息

2026-01-23 06:57

比特币最大的批评者希夫承认比特币价格尚未崩盘

2026-01-23 06:51