Diffuti0n - 搜索 News

从视觉出发统一多模态！颜水成团队最新研究：不再把图像编解码器 ...

首个 visual prior unified discrete diffusion model，用一套离散扩散框架同时打通文生图、图生文和VQA AI大模型，可能正在悄悄换基座。过去几年，整个行业最熟悉、也最成功的预训练范式，几乎都围绕同一个问题展开：预测下一个词。从GPT到后来的各种视觉语言模型 ...

搜狐

一分钟做出高级感创意logo！实测多款AI工具，这款才是小白天花板

想做专属品牌logo，却愁于没设计功底、找设计师太贵、等稿周期太长？别再盲目试错各类AI工具，实测对比多款热门logo生成神器，终于挖到一款**零门槛、高效率、高质感**的宝藏工具——简单AI，真正实现一分钟搞定高级感创意logo，新手也能轻松拿捏品牌视觉！

2 小时

杨立昆再联手谢赛宁，英伟达参投，新公司押注「LLM 之后」

在《麻省理工科技评论》专访中，杨立昆表示：「为什么我们没有一个像家猫一样敏捷的家用机器人」——这句话背后是「莫拉维克悖论」：感知、运动协调、物理直觉，这些对人类来说不需要思考的能力，对 AI 来说恰恰是最难的部分，而 LLM 完全绕开了这些。

腾讯网

从Sora惊恐到即梦反杀，中国的AI视频生成之路

时间倒回两年前，AI视频生成还是一个被认为“中国完全做不出来”的赛道。OpenAI的Sora在2024年初横空出世，一支“女生走在东京街头”的60秒视频，画面逼真程度堪比实拍，而彼时的国产视频模型，大多只能生成5—12秒的画面，表情僵硬、手指穿模、物理穿帮都是常态，效果一眼假。

腾讯网

极氪7X夺中国香港1-2月豪华SUV销冠销量772台

【太平洋汽车新车频道】日前，极氪汽车官方宣布，根据香港交通署公布的最新统计数据，旗下纯电中型SUV——极氪7X在2026年1月至2月累计销量达772台，成功登顶中国香港豪华SUV销量冠军。与此同时，该车在澳大利亚市场2月单月销量也达到628台，同样斩获当地 ...

4 小时

NASK国家研究所：如何让AI图像生成器变得更安全？

来自波兰NASK国家研究所、华沙理工大学以及德国CISPA信息安全研究中心的研究团队，在2026年3月发表了一项突破性研究，提出了一种名为"条件激活传输" (CAT)的新方法。这项研究发表在顶级人工智能会议上，论文编号为arXiv:2603.03163v1，为解决AI图像生成的安全问题开辟了全新的道路。

11 小时

Suno 压力大了！腾讯联手清华发布 SongGeneration 2，音素错误率低至 8.55%

最令开发者振奋的是，腾讯此次展现了极大的开源诚意。拥有4B 参数的 SongGeneration-v2-large 模型已正式开源，支持中英等多语种生成。令人惊讶的是，它在配备 22GB 显存的消费级硬件上即可流畅运行，实现了本地化、私密化创作的可能。

11 小时on MSN

从训练到推理：高效扩散语言模型如何跨越效率瓶颈实现突破?

生成式人工智能领域正经历一场范式变革。自回归模型凭借“从左到右”的串行生成机制长期占据主导地位，但其固有缺陷逐渐显现——并行计算能力受限、长文本生成效率低下等问题，成为制约技术突破的关键瓶颈。在此背景下，扩散语言模型（dLLMs）凭借独特的非自回归架构引发学界与产业界广泛关注，其通过迭代去噪实现文本优化的机制，不仅支持双向上下文建模，更开创了多token并行 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果