首个 visual prior unified discrete diffusion model,用一套离散扩散框架同时打通文生图、图生文和VQA AI大模型,可能正在悄悄换基座。 过去几年,整个行业最熟悉、也最成功的预训练范式,几乎都围绕同一个问题展开:预测下一个词。 从GPT到后来的各种视觉语言模型 ...
想做专属品牌logo,却愁于没设计功底、找设计师太贵、等稿周期太长?别再盲目试错各类AI工具,实测对比多款热门logo生成神器,终于挖到一款**零门槛、高效率、高质感**的宝藏工具——简单AI,真正实现一分钟搞定高级感创意logo,新手也能轻松拿捏品牌视觉!
在《麻省理工科技评论》专访中,杨立昆表示:「为什么我们没有一个像家猫一样敏捷的家用机器人」——这句话背后是「莫拉维克悖论」:感知、运动协调、物理直觉,这些对人类来说不需要思考的能力,对 AI 来说恰恰是最难的部分,而 LLM 完全绕开了这些。
时间倒回两年前,AI视频生成还是一个被认为“中国完全做不出来”的赛道。OpenAI的Sora在2024年初横空出世,一支“女生走在东京街头”的60秒视频,画面逼真程度堪比实拍,而彼时的国产视频模型,大多只能生成5—12秒的画面,表情僵硬、手指穿模、物理穿帮都是常态,效果一眼假。
【太平洋汽车 新车频道】日前,极氪汽车官方宣布,根据香港交通署公布的最新统计数据,旗下纯电中型SUV——极氪7X在2026年1月至2月累计销量达772台,成功登顶中国香港豪华SUV销量冠军。 与此同时,该车在澳大利亚市场2月单月销量也达到628台,同样斩获当地 ...
来自波兰NASK国家研究所、华沙理工大学以及德国CISPA信息安全研究中心的研究团队,在2026年3月发表了一项突破性研究,提出了一种名为"条件激活传输" (CAT)的新方法。这项研究发表在顶级人工智能会议上,论文编号为arXiv:2603.03163v1,为解决AI图像生成的安全问题开辟了全新的道路。
最令开发者振奋的是,腾讯此次展现了极大的开源诚意。拥有4B 参数的 SongGeneration-v2-large 模型已正式开源,支持中英等多语种生成。令人惊讶的是,它在配备 22GB 显存 的消费级硬件上即可流畅运行,实现了本地化、私密化创作的可能。
生成式人工智能领域正经历一场范式变革。自回归模型凭借“从左到右”的串行生成机制长期占据主导地位,但其固有缺陷逐渐显现——并行计算能力受限、长文本生成效率低下等问题,成为制约技术突破的关键瓶颈。在此背景下,扩散语言模型(dLLMs)凭借独特的非自回归架构引发学界与产业界广泛关注,其通过迭代去噪实现文本优化的机制,不仅支持双向上下文建模,更开创了多token并行 ...