人工智能测评 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 人工智能测评

时间 详情
2026-01-22
01:09
Anthropic公布Opus 4.5击败工程考试,揭秘AI抗性技术评估新策略

据Anthropic官方账号(@AnthropicAI)透露,该公司原本为性能工程候选人设计了一套极具挑战性的家庭作业考试,有效筛选了人类应聘者。但随着Opus 4.5 AI模型成功解答全部题目,Anthropic被迫重新设计评测方法。官方博客详细介绍了公司如何开发具有AI抗性的技术评估体系,确保测试既能精准衡量人类工程技能,又能防止AI轻松通过。这一变化凸显了AI招聘流程中的新趋势,并对如何区分人机技术能力提出了更高要求。来源:Anthropic Engineering Blog(anthropic.com/engineering/AI-resistant-technical-evaluations)