始智AI wisemodel.cn社区是源自中国的中立开放的AI开源社区。正在招募 | 新一期开源共创志愿者计划,欢迎加入共同成长。wisemodel社区算力平台上线,价格实惠,灵活方便,支持在线微调训练模型,及模型在线体验和专属API服务,并全面支持ollama在线运行。 统一多 ...
在处理长文本任务时,大语言模型的注意力机制往往会陷入“二次复杂度”的泥潭。为了解决这个问题,研究者们提出了各种稀疏注意力方案,但往往需要在预处理开销、全局评估能力和查询独立性之间做艰难的取舍。最近,来自百度和北京大学的研究团队提出了一种名为 ...
OpenAI o1 和 DeepSeek-R1 靠链式思维(Chain-of-Thought, CoT)展示了超强的推理能力,但这一能力能多大程度地帮助视觉推理,又应该如何细粒度地评估视觉推理呢? 为此,来自港中文 MMLab 的研究者们提出了 MME-CoT。 这是一个全面且专门用于评估 LMMs 中视觉推理能力的 ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果