更巧的是,同一周,宾大团队的独立审计报告和Anthropic的Mythos Preview系统卡同时出炉,三条线指向同一个结论:这些评测基准,从设计到执行,到处是漏洞。
Anthropic 最强的模型,也是他们不敢发布的模型 作者: 一涛 编辑: Koji‍ 排版: NCon2026 年 4 月 7 日,Anthropic 发布了一份 245 页的技术报告,介绍了他们迄今为止能力最强的模型 Claude Mythos ...