DPO - 搜索 News

DPO与GRPO谁更胜一筹？港中文、北大等联合发布首个系统性对比研究

近年来，强化学习 (RL) 在提升大型语言模型 (LLM) 的链式思考 (CoT) 推理能力方面展现出巨大潜力，其中直接偏好优化 (DPO) 和组相对策略优化 (GRPO) 是两大主流算法。如今，这股 RL 的浪潮也涌向了图像生成领域。当我们将自回归图像生成也视为一种序列化的 CoT ...

中关村在线

这本写给DPO的白皮书终于来了！解读企业级数据安全合规体系

“DPO需要帮助企业建设完整的数据安全技术体系、数据安全管理体系以及运营体系，才能在长期范围内用更少的成本做到业务风险可控。” StartDT Research Center，《DPO数据安全白皮书》 DPO，即Data Protection Officer，中文通译为数据保护官。这个职位的设定最早来源于 ...

36氪

多图场景用DPO对齐，上海AI实验室等提出新方法，无需人工标注

多图像场景也能用DPO方法来对齐了！由上海交大、上海AI实验室、港中文等带来最新成果MIA-DPO。这是一个面向大型视觉语言模型的多图像增强的偏好对齐方法。通过将单图像数据扩展至多图像数据，并设计序列、网格拼贴和图中图三种数据格式，MIA-DPO大幅降低 ...

雷锋网

上科大何旭明团队新作：克服简单样本偏置，让多模态模型学会「 ...

导语：DA-DPO 不依赖额外标注，通过难度感知训练提升模型可靠性。多模态模型在感知、理解与生成等方面的能力持续提升，但其输出中仍普遍存在与客观事实不一致的内容，即多模态幻觉现象。当模型面对信息缺失、语义含混或视觉细节复杂的场景时，往往会 ...

中国日报网

DPO数据保护官认证带你走出数据合规困境

只要处理个人数据，就会引发隐私问题。 2018年在GDPR法案在欧盟正式颁布后，EXIN是全球早期的基于《欧盟通用数据保护条例 ...

凤凰网

DPO与IPO有何不同？看美股第一家DPO中国公司诞生记

美国当地时间6月11日上午，中指控股（CIH）正式在纳斯达克上市。当天，中指控股（CIH）CEO黄瑜携主创团队一行三十多人一起敲响了象征公司登陆纳斯达克的开市钟，这也预示着第一家在美股采取直接上市（DPO）形式的中国“独角兽”正式诞生！黄瑜在发表致辞 ...

36氪

中指控股今晚正式登陆纳斯达克，或成首家DPO中国公司

北京时间6月11日晚上21时，中指控股有限公司（China Index Holdings Ltd，以下简称中指控股）将正式登陆纳斯达克交易所，股票代码为CIH。《每日经济新闻》记者独家获悉，中指控股将采用“直接上市”（DPO）的方式在纳斯达克交易所挂牌交易，或成为纳斯达克交易 ...

电子工程专辑

7系列DPO示波器

今天是泰克科技（Tektronix）发展史上的里程碑时刻。我们正式发布两项突破性成果——全新7系列DPO示波器与MP5000系列模块化精密测试系统，它们将重新定义测试与测量领域的各种可能性。初看之下，二者满足的需求和场景各不相同；但合而观之，它们却承载着 ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果