自 2020年启动“悟道”大模型研究以来,智源持续聚焦大模型的原始创新与长期技术路径探索。2025年6月,智源发布新一代大模型系列“悟界”,旨在构建人工智能从数字世界迈向物理世界的关键能力,及物理世界的人工智能基座模型。这其中包括:Emu ...
29日,95后顶尖AI科学家庞天宇通过小红书官宣个人已经加入腾讯混元团队,并担任首席研究科学家(Principal Scientist,或称首席 / 主任研究员),并写明是“Tech Lead@Multimodal RL Team”,即多模态强化学习技术负责人。
Nature编辑点评这项研究:Emu3仅基于预测下一个词元(Next-token prediction),实现了大规模文本、图像和视频的统一学习,其在生成与感知任务上的性能可与使用专门路线相当,这一成果对构建可扩展、统一的多模态智能系统具有重要意义。
Nature编辑点评这项研究:智源提出的Emu3仅基于预测下一个词元,实现了大规模文本、图像和视频的统一学习,其在生成与感知任务上的性能可与使用专门路线相当,这一成果对构建可扩展、统一的多模态智能系统具有重要意义。
微软于2024年12月发布的小型语言模型(SLM) Phi-4因其卓越性能获得广泛关注,如今这一系列迎来重要扩展。近日,微软正式推出两款全新成员:Phi-4-Multimodal(多模态)及Phi-4-Mini(迷你版),进一步丰富了Phi-4产品家族。 Phi-4-Multimodal是微软首款采用统一架构的多 ...
本研究针对现有过敏原预测工具性能不足的问题,开发了整合蛋白质理化性质、氨基酸序列和进化信息的多模态深度学习框架Multimodal-AlgPro。通过系统评估2047种模态组合,发现进化保守特征与序列特征的协同作用可显著提升预测精度(准确率93.9%),并成功鉴定 ...