Prime Intellect - 搜索 News

Arcee AI发布Trinity Large：400B参数的超稀疏混合专家大语言模型，用稀疏 ...

Trinity模型的架构设计体现了多项技术突破。研究团队采用了交错的局部和全局注意力机制，这就像人类阅读时的视觉模式：既有聚焦细节的局部视野，又有把握全局的宏观视角。局部注意力负责处理相邻信息之间的关系，而全局注意力则确保模型能够理解长距离的依赖关系。这种设计让模型在处理长文本时既保持了精确性，又大大提高了处理效率。

来自MSN

全球首创：分布式技术让普通人电脑也能参与超大型AI模型训练

在2025年的科技界，一项由Prime Intellect团队带来的革命性突破引发了广泛关注。该团队成功实现了320亿参数大型语言模型的完全分布式强化学习训练，这一成果于同年5月在arXiv平台上以论文编号arXiv:2505.07291v1发表。这项研究的核心在于，它将AI模型的训练过程从 ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果

Arcee AI发布Trinity Large：400B参数的超稀疏混合专家大语言模型，用稀疏 ...

全球首创：分布式技术让普通人电脑也能参与超大型AI模型训练

今日热点