论文名叫ARL-Tangram: Unleash the Resource Efficiency in Agentic Reinforcement Learning。作者之一,就是罗福莉。 要用GPU去做模型推理,要用CPU去执行代码,要用API去处理搜索、数据库,可能还要用浏览器进行网页操作 ...
2026 年的前两个月,开源大模型的发布节奏已快至令人应接不暇。Arcee AI 的 Trinity Large、月之暗面的 Kimi K2.5、阿里的 Qwen3.5、智谱 AI 的 GLM-5、Cohere 的 Tiny ...
Raschka 在图集中把各模型的专家数量、激活比例、专家隐藏层尺寸都标注出来,让稀疏程度一目了然。Hacker News 上有人感慨:“我很惊讶这些模型在结构上有多相似,主要差异就是层的大小。” ...
3月16日消息,小米AI实验室研究员罗福莉,也就是很多人口中的“天才少女”,又发论文了。论文名叫ARL-Tangram: Unleash the Resource Efficiency in Agentic Reinforcement ...
K近邻算法,采用测量不同特征值之间的距离进行分类.(本项目以欧氏距离作为距离计算方法) 理论: 存在一个样本数据集合,也称作训练样本集,并且样本集每个数据存在标签.即我们知道样本 集每一数据与所属分类的对应关系.输入没有标签的新数据后,将新数据的 ...
天天上班的你,有多少「摸鱼」的时间?此前,澳大利亚悉尼大学的研究人员在《Educational and Developmental Psychologist》期刊上发表了一篇题为“Rest breaks aid directed attention and learning”的研究论文,指出摸鱼可以提升工作效率,五分钟的大脑休息,可以将后续任务的表现和生产力平均提高 57%,更有利于后续的工作。
MIT 研究生用 NotebookLM 48 小时学完一学期 刷到一条推文,430 万阅读,1.5万点赞,3 万收藏。收藏数比点赞数还高一倍,说明大家不只是觉得"有意思",是真想存下来自己试。推文作者 Ihtesham Ali 说他偶然发现了一个 ...
《hzwer 的 OpenClaw 实战完全指南:让小龙虾 24 小时值班干活》 深度使用了两周,来总结一些工作流和坑点。因为每个人遇到的问题可能不同,我也只是在我的一些任务上跑通流程,仅供参考,欢迎拍砖。 注意:本文代码块内容不是给人读的,基本是要发给小龙虾读 核心定位:OpenClaw 是 AI 的 OS Shell,通过飞书/TG 实现 24 ...
在Agent席卷产业的浪潮中,越来越多企业开始将AI Agent接入研发、数据分析和自动化运维流程。但是针对Agent的安全研究给出了警示:当Agent可以访问本地接口和系统资源时,一旦权限控制不当,攻击者可能借助AI执行任意代码、窃取数据甚至接管设 ...
作者 | 木子说起 AI Coding,之前很多人好歹还有个“心理安慰”:AI 也就写写“脚手架代码”、补补前端页面,真到核心算法、业务逻辑,还是得人来。但这道“最后防线”,也正在松动。谷歌 DeepMind 最近做了一件更狠的事:他们让 LLM ...
当我们让一个智能推理模型解决数学题时,通常会让它生成多个答案,然后选择出现次数最多的那个作为最终答案。这种做法看起来很合理,就像多个人投票选择答案一样。但是,来自斯坦福大学和慕尼黑大学路德维希-马克西米利安分校的研究团队最近发现了一个严重问题:当这些模型在错误答案上形成"共识"时,就会陷入越来越深的错误循环。 这项名为"Tool Verification ...