Cache Memory - 搜索 News

2 天

AI下半场的战场，从Agent记忆体正式打响

在真实部署中，Agent 面对的不再是静态 prompt，而是动态环境。网页状态在变，文件系统在更新，工具输出不断叠加，权限与约束持续变化。context 的增长不只是对话历史延长，而是跨时间、跨系统、跨任务的状态积累。

2 天

Meta 删邮件事故背后，OpenClaw 为什么会“失忆”？代码库维护者拆解 ...

“我是 OpenClaw 代码库的维护者，所以本文的深度超过大多数指南。” 每个 OpenClaw 用户可能都会遇到同样的难题。在最初的 20 分钟内，这个代理（Agent）工作得很好，然后就开始偷偷地丢失指令，变得失控。 Summer Yue 是 Meta 超级智能实验室的对齐总监，她告诉 OpenClaw 代理：“检查这个收件箱，提供归档或删除建议。在我发话之前不要做任何事。”在测试收件箱上， ...

腾讯网

KV Cache管理架构演进：从连续分配到统一混合内存架构

点击上方“Deephub Imba”,关注公众号,好文章不错过 !在生产环境部署过LLM的人都知道模型权重只是问题的一半，另一半是KV ...

腾讯网

vLLM 吞吐量优化实战：10个KV-Cache调优方法让tokens/sec翻倍

GPU 性能没问题，模型也训练得不错，但 token 吞吐量就是上不去？问题多半出在 KV-cache 上。本文整理了 10 个实际可用的优化方向，都是能直接上生产环境的那种。把 utilization 往上调，直到不再频繁出现 preemption；然后再调 max-num-seqs，让批次保持密集但别超出 ...

电子工程专辑

内存中的数据是如何被加载到 cache 的

本文属于讲述memory相关知识系列文章的第一篇，主要讲述主存的组织结构。将从最上层的memory channel开始介绍，一直到底层的bank。同时还会介绍memory controller相关的知识。最后以例子一次memory request是如何填充一行cache line的结束。要了解数据是怎么从main memory ...

搜狐

2025年GPU Scale-up 互联技术白皮书

字节跳动发布的《GPU Scale-up 互联技术白皮书》深入剖析了 GPU 架构、互联方案，洞察下一代 Scale-up 互联需求并提出创新网络方案，着重展现了其自研的 EthLink 网络方案的独特优势。在 GPU 架构层面，主流架构支持 Load-Store 语义，计算引擎专注数据处理，LSU 负责 ...

eeworld.com.cn

26.核心初始化之关闭MMU和cache

下面看看ARM存储体系：可以看到速度最快的是处理器和内部寄存器，他们的数量很少，价格很昂贵。接着是TCM紧耦合存储器：cache和main memory。速度最慢的是外部存储介质：Flash和SD卡等。上面是两种访存的两种机制，一种是处理器直接访问主存，另一种是处理器 ...

IT之家

2499 元起，AMD RX 6600 显卡发布：1792 流处理器 + 8GB 显存

IT之家10 月 13 日消息，AMD 今日发布了 Radeon RX 6600 显卡，旨在为中端游戏市场带来高刷新率的 1080p 游戏体验。 AMD Radeon RX 6600 显卡采用 RDNA 2 架构，具备 32MB 高性能 AMD 高速缓存（AMD Infinity Cache）、8GB GDDR 6 显存、AMD 显存智取（AMD Smart Access Memory）。

coolshell.cn

缓存更新的套路

看到好些人在写更新缓存数据代码时，先删除缓存，然后再更新数据库，而后续的操作会把数据再装载的缓存中。然而，这个是逻辑是错误的。试想，两个并发操作，一个是更新操作，另一个是查询操作，更新操作删除缓存后，查询操作没有命中缓存，先把老 ...

中关村在线

买PC就要选对CPU 7款台式机对比实测

内存的性能也是评价计算机整体性能的重要指标之一，本次我们将使用AIDA64自带的Cache& Memory Benchmark功能，来对7套平台内存的读取、写入、拷贝及延迟等参数进行测试。虽然两天APU平台在内存的读取速度上相比其他平台略有优势，但其写入和拷贝的速度表现很不 ...