近日,由山东大学领衔,联合香港科技大学(广州)、香港科技大学、美国哥伦比亚大学以及西安交通大学的研究团队,在 AAAI 2026 上发表了一项引人深思的研究。他们提出了首个专门用于评估手机智能体隐私意识的大规模基准测试—— SAPA-Bench 。该基准的名字全称为 S martphone A gent P rivacy A wareness Bench mark,意在提醒开发者和用户:在赋予 ...
点击上方“Deephub Imba”,关注公众号,好文章不错过 !这篇文章从头实现 LLM-JEPA: Large Language Models Meet Joint Embedding Predictive Architectures。需要说明的是,这里写的是一个简洁的最小化训练脚本,目标是了解 JEPA 的本质:对同一文本创建两个视图,预测被遮蔽片段的嵌入,用表示对齐损失来训练。本文的目标是 ...
1月12日晚,DeepSeek发布新论文《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》,该论文由北京大学与DeepSeek团队共同完成,作者署名中有DeepSeek创始人 梁文锋 。同日,DeepSeek开源相关记忆模块Engram。
近日,东软集团(Neusoft Group)与全球领先的人工智能技术公司Cerence AI正式签署战略合作协议,旨在联合开发下一代智能座舱平台。此次合作将聚焦智能语音和大型语言模型(Large Language Model)等前沿技术,目标是为全球汽车制造商提供高效、预集成的智能交互解决方案。
8月29日,国际首个月球科学多模态专业大模型在2024中国国际大数据产业博览会上发布。 On August 29, the world's first professional, multimodal large language model (LLM) for the field of lunar science has been released at the China ...
我国研发的全球首个多模态地理科学大模型“坤元”近日在京发布。“坤元”由中国科学院地理科学与资源研究所、中国科学院青藏高原研究所、中国科学院自动化研究所等单位共同研发。 A geographic sciences multi-modal Large Language Model, the first of its kind in the world, was ...
新京报贝壳财经讯(记者罗亦丹)1月12日晚间,DeepSeek发布了一篇新论文,主题为《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language ...
观点网讯: 1月12日晚间,DeepSeek发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》(基于可扩展查找的条件记忆:大型语言模型稀疏性的新维度)。