What Is a Transformer

估值 1200 亿后 Kimi 再扔王牌，新架构爆改 Transformer 老配件，比 DeepSeek ...

作者 | 允毅连马斯克、Andrej Karpathy 都纷纷点赞，DeepSeek 和 Kimi 前后脚都盯上的 “残差连接”，到底是什么？最近，Kimi 放出一篇重磅新论文，瞄准一个过去十年几乎没人动过的 Transformer ...

12 小时

原创马斯克深夜点赞炸场！Kimi撕开Transformer十年铁幕，中国AI亮剑

2026年3月17日，马斯克在X平台的一条推文打破了AI圈的平静。这位以“技术挑剔”著称的科技狂人，罕见转发并点赞了中国AI公司月之暗面（Moonlight ...

2 天

奥特曼宣判Transformer死刑，AGI两年内降临，下一代架构已在路上

终结Transformer的架构即将诞生！奥特曼最新访谈豪言，下一代AI架构彻底颠覆Transformer，LSTM的命运或将再次上演。 Transformer的最大受益者，亲手给它判了死刑！这几天，Sam ...

腾讯网

Arm Flexible Access让端侧跑起Transformer，边缘AI再提速

边缘AI正在从概念走向落地，但端侧设备的算力、功耗、成本约束始终是方案商需要平衡的难题。近日，Arm技术授权订阅模式中的Arm Flexible ...

1 天

卡帕西点赞Transformer内置计算机！每秒3万Token吞吐，拿下世界最难数独

LLM推理已经顶尖，精确计算却跟不上。这局怎么破？卡帕西点赞的解决方法来了，在大模型内部构建一台原生计算机。新方法不搞外包那一套（不依赖任何外部工具），直接在Transformer权重里内嵌可执行程序。并通过创新的2维注意力头设计，将大模型的推理效率提升至指数级。能在普通CPU上实现每秒3万+Token的流式输出。在Transformer内嵌原生计算机咱都知道，当前最先进的大模型，拿 ...

2 天

Transformer祖制，被Kimi捅破了！谷歌大V高赞：Kimi触碰了十年没人敢碰 ...

残差连接（Residual connections）搭配 ...

55 分钟

Kimi“打破Transformer架构”真相

它并非推翻Transformer的神话，而是为这座大厦添上了一块关键的砖石。本周，一篇题为《Attention ...

12 天

Transformer 论文作者“菠萝哥”重造“龙虾”：Rust 搓出钢铁版，告别 ...

有多少龙虾在互联网上裸奔？AI 智能体带着你的密码和 API 密钥暴露给全网。 Transformer 作者 Illia Polosukhin 看不下去了。出手从零重构了安全版龙虾：IronClaw。 IronClaw 目前已在 GitHub 上开源，提供 macOS、Linux 和 Windows 的安装包，支持本地部署，也支持通过云端托管。项目仍处于快速迭代阶段，v0.15.0 版本的二进制文 ...

至顶AI实验室 on MSN

DeepMind世界模型研究员：是否Transformer架构不重要，AGI瓶颈在别处

Demis Hassabis在CNBC开年采访中给了一个判断：AGI还差一块拼图，可能是世界模型。他维持"5-10年实现AGI"的预测。2010年创立DeepMind时，他预计这是一个20年的任务，现在看来进度符合预期。但他也承认，Scaling ...

2 天on MSN

奥特曼断言Transformer将成过去式 AGI两年将至新架构革命蓄势待发

在斯坦福大学的一场特别访谈中，OpenAI首席执行官山姆·奥特曼向一群大二学生透露了一个震撼消息：下一代人工智能架构正在酝酿之中，其性能提升将不亚于当年Transformer对LSTM的革命性突破。这一言论引发了科技界的广泛关注，因为当前几乎所有大型语言模型，包括ChatGPT和GPT-4，都建立在Transformer架构之上。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果