这听起来有点反直觉,但背后的设计思想,恰恰是当前 AI 工程化落地非常值得借鉴的思路。本文将结合测试开发的实际工作场景,拆解这套“自我进化”的机制,并给出测试开发在 AI 项目中可以扮演的角色和具体代码示例。
博士生Hanchen Li和合作者Hao Wang等人发布名为“Terminator-1”的AI Agent,声称其在两大主流编码基准——SWE-bench Verified和Terminal-Bench上取得95%以上的高分,甚至部分达到100%。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果