在AI图像生成领域,2025年末迎来了一场技术地震。谷歌推出的Nano Banana Pro(官方名Gemini 3 Pro Image)不仅是一次版本迭代,更是从根本上重新定义了AI视觉生成的边界与可能性。这款基于Gemini 3 Pro架构构建的模型,实现了从“感性艺术创作”到“理性视觉工程”的范式跃迁,将大型语言模型的“思维链”机制深度植入了图像生成的底层逻辑中。 与传统AI绘图模型相比,N ...
在AI图像生成领域,2025年末迎来了一场技术地震。谷歌推出的Nano Banana Pro(官方名Gemini 3 Pro Image)不仅是一次版本迭代,更是从根本上重新定义了AI视觉生成的边界与可能性。这款基于Gemini 3 Pro架构构建的模型,实现了从“感性艺术创作”到“理性视觉工程”的范式跃迁,将大型语言模型的“思维链”机制深度植入了图像生成的底层逻辑中。 与传统AI绘图模型相比,N ...
为模拟真实编辑场景并系统评估学术海报自动编辑能力,团队通过参考导向与无参考优化两种方式构建了首个学术海报编辑基准测试APEX-Bench,该基准覆盖 59 篇 ICLR、ICML、NeurIPS ...
当Claude Cowork刷屏时,我发现国产早就做了 最近AI圈被Claude Cowork刷屏了,Anthropic官方演示的那个自动整理文件夹、定时执行任务的Demo,让无数人惊呼“AI Agent终于能干实事了”。
数学家陶哲轩表示,GPT-5.2 Pro 在至少一个 Erdős 问题上,几乎独立地完成了解答过程。这可能是“AI 解决开放问题的最明确的案例”。 GPT-5.2 Pro 是 OpenAI 于 2025 年发布的最新高级模型系列之一,其定位是针对专业复杂任务提供更强推理、结构化输出能力的工具。 OpenAI 官方文档也指出,GPT-5.2 系列在科学与数学任务方面有显著进步,能够生成详细结构化论证 ...
豆包与浦东美术馆合作上线“官方AI讲解员”,美术馆,史密斯,保罗,奥斯曼,豆包,讲解员 ...
该AI初创公司此前曾在去年的9月份进行过一次融资,当时的融资额约为2.5亿美元,估值约为30亿美元,意味着该公司最新估值比上一轮几乎翻了三倍。支持该公司的核心机构投资者包括Amex Ventures、美国科技巨头谷歌旗下的 AI Futures Fund,以及 Bloomberg LP.旗下的风险投资部门Bloomberg Beta。
技术只有变得足够“便宜”,才能实现真正“普及”,从而深度融入到工作与生活的方方面面。 所以,当GLM-Image在API调用模式下生成一张图片只需0.1元时,价格仅为海外同类产品的1/10至1/3,全球AI市场都为之震撼。
回头来看,美团大模型站到台前时间并不算长但节奏清晰,首次亮相在 2025 年 9 月,此后保持了每月一更的开源节奏,不断扩容自己的能力库:从强调响应速度的 LongCat-Flash-Chat 到专注逻辑的 Thinking ...
当价格下降、能力趋同、每个创业公司都能调用同样的API时,什么才能让你的AI产品与众不同?答案就藏在你的业务知识、用户洞察、踩过的坑和积累的经验里——这些无法下载的语境,才是真正的护城河。
科技界近日掀起热议,马斯克在一场长达三小时的深度访谈中,围绕人工智能发展、教育变革及职业选择等话题展开探讨,其观点引发广泛关注。这场访谈不仅涉及未来科技趋势的预测,更对传统教育路径和职业规划提出颠覆性思考。
过去几周,我对于 Vibe Engineering 的实践有了更多的体会, 今天再次总结一下。其实也能看出来我避免使用 Vibe Coding 这个词,是因为当下的重点已经不再是代码,而是一些更高维度的东西。另外,本文的 AI 含量我会尽量控制在 5 ...