活跃在AGI基础研究前沿的技术团队UniPat AI构建了一个极简的视觉智能体框架——SWE-Vision,让模型可以编写并执行Python代码来处理和验证自己的视觉判断。在五个主流视觉基准测试中,SWE-Vision均达到了当前最优水平。
模态大模型在代码能力上进步惊人,但在基础视觉任务上却频繁失误。UniPat AI 构建了一个极简的视觉智能体框架——SWE-Vision,让模型可以编写并执行 Python 代码来处理和验证自己的视觉判断。在五个主流视觉基准测试中,SWE-Vision 均达到了当前最优水平。
该攻击活动以OpenAI Atlas浏览器为诱饵,通过Google赞助搜索结果传播,将用户引导至虚假的Google Sites网址。该网址包含一个下载按钮,点击后会显示打开终端应用程序并粘贴命令的指令。这一操作会下载一个shell脚本,提示用户输入系统密码,并以用户级权限运行MacSync。
3月16日消息,小米AI实验室研究员罗福莉,也就是很多人口中的“天才少女”,又发论文了。论文名叫ARL-Tangram: Unleash the Resource Efficiency in Agentic Reinforcement Learning。作者之一,就是罗福莉。如果只看标题,这篇论文似乎只是一个偏工程的研究:如何让AI ...
尽管业界普遍推荐,但苏黎世联邦理工学院(ETH Zurich)的一篇新论文得出结论, AGENTS.md 文件可能经常阻碍 AI 编码智能体。研究人员建议完全省略由 LLM ...
这是一篇,写了两天,可能会有一点长的文章。 也是我从一个10年经验的用户体验设计师和一个30人公司的创始人的视角,来聊一聊,这个时代,我对软件、对Agent、对组织的一些些看法。 也试图理清我自己的一些思路。 很多东西不一定对,但是确实是我想表达的。 起因这两天刷X的时候,有个很火的帖子,现在已经1个亿的浏览量了。 就一句话。 "Software was eaten by AI." 翻译过来,其实 ...
人工智能领域正经历一场从“模型中心”向“Agent系统”的范式转移。传统AI系统以单一模型为核心,通过输入数据、模型计算、输出结果的线性流程完成任务,其资源消耗集中于GPU算力。但随着AI Agent技术的突破,计算模式发生根本性变化——系统开始整合GPU、CPU、API接口、存储设备和网络资源,形成多维度资源协同的复杂架构。 以典型任务为例,现代AI ...