DeepSeek V4 模型以 CUDA + Tilelang 组合方式使用了数十个算子。为了能在多种 AI 芯片上运行 DeepSeek V4,众智 FlagOS 采用 Triton/Triton-TLE 重写了全部新增算子,并基于 ...
这是英伟达CEO黄仁勋近期在一档播客节目中发出的警告。让他发出警告的对象,是即将发布新模型的中国AI公司DeepSeek。 让黄仁勋警惕的,并不是某个具体的模型能力,而是另一件事——综合多家权威媒体报道: DeepSeek-V4 ...
随着英特尔至强600系列和锐炫Pro B系列正式发布,英特尔针对高性能工作站领域打出了一套强有力的组合拳。在整个行业都在为AI计算倾倒的同时,非AI领域的专业计算性能提升也同样迫在眉睫。面对AI与传统算力的需求,至强600系列和锐炫Pro ...
FlagGems 作为全球最大的 Triton 单一算子库,已拥有超过400 个大模型常用算子,并已正式进入 PyTorch 基金会生态合作项目。在 40 个主流模型上,推理任务算子覆盖度达到 90%~100%,完整支持 ...
这项由NVIDIA研究团队主导完成的研究成果,以预印本形式发布于2026年2月,论文编号为arXiv:2604.09557v1,收录于计算机分布式系统领域(cs.DC)。有兴趣深入了解的读者可以通过该编号在arXiv平台查阅完整论文。 每次你向ChatGPT或者其他大型语言模型提问,背后发生的事情比你想象中复杂得多。模型不是一次性"想出"完整答案然后发给你的,而是像打字员一样,一个字一个字地生成。
36氪暗涌Waves 2024年7月曾在专访DeepSeek创始人梁文锋的报道中称,DeepSeek是中国大模型创业公司中,唯一一家放弃“既要又要”路线,一直专注研究和技术的公司。也是唯一一家未全面考虑商业化,坚定选择开源路线甚至都没融过资的公司。
AI评测领域近日掀起轩然大波,多个主流基准测试的可靠性遭到严重质疑。伯克利大学研究团队通过开发自动化漏洞扫描工具,成功攻破八大权威评测体系,其中SWE-bench编程基准更被10行Python代码轻松破解,500道测试题全部获得满分却未修复任何真实漏洞。
这项由英伟达(NVIDIA)研究团队主导的研究成果,以技术报告形式于2026年4月14日发布,论文编号为arXiv:2604.12374v1,分类在计算机科学机器学习领域。有兴趣深入了解的读者可通过该编号在arXiv平台查询完整论文。 每当人们谈起AI模型,总会面临一个两难困境:要么模型聪明但运行慢,要么跑得快但能力弱。这就像选车一样——豪华轿车舒适但油耗高,经济型小车省油但动力不足。英伟达的研究 ...
全球首位AI软件工程师Devin诞生了,它掌握全栈技能,云端部署、底层代码、改bug、训练和微调AI模型都不在话下。最可怕的是,它完全不怕996,老黄的预言是彻底成真了!