Modula VLM - 搜索 News

DeepSeek最新王炸模型：VLM架构重磅突破，AI像人一样读图

智东西1月27日报道，刚刚，DeepSeek开源了其面向OCR场景的专用模型DeepSeek-OCR 2，技术报告同步发布。这一模型是对去年DeepSeek-OCR模型的升级，其采用的新型解码器让模型看图、读文件的顺序更像人，而不是像机械的扫描仪。简单来说，以前的模型阅读模式是从 ...

Infobae

Así es CLOiD, el robot doméstico del CES que cocina, lava y coordina todo en el hogar

CLOiD, el robot doméstico de LG, inaugura una nueva era de inteligencia artificial y modularidad en la vida cotidiana - crédito Fotomontaje Infobae (Steve Marcus/LG) El CES 2026 abrió sus puertas en ...

电子工程专辑

2025年十大主流的视觉语言大模型(VLM)

视觉语言模型（VLM）是同时处理图像和文本的人工智能系统。它们连接了计算机视觉（理解视觉数据的人工智能）与自然语言处理（理解语言的人工智能）。2025年最具影响力的十大视觉语言模型（VLM）的更深入概述，解释它们在不同用例中的差异——涵盖视频 ...

IT之家

从“只会看路”到“情境感知”：ICCV 2025 自动驾驶挑战赛冠军方案详解

近日，在全球权威的 ICCV 2025 自动驾驶国际挑战赛（Autonomous Grand Challenge）中，浪潮信息 AI 团队所提交的“SimpleVSF”（Simple VLM-Scoring Fusion）算法模型以 53.06 的出色成绩斩获端到端自动驾驶赛道（NAVSIM v2 End-to-End Driving Challenge）第一名。 SimpleVSF ...

极客公园

从「只会看路」到「情境感知」：ICCV 2025 自动驾驶挑战赛冠军方案详解

近日，在全球权威的 ICCV 2025 自动驾驶国际挑战赛中，浪潮信息 AI 团队所提交的「SimpleVSF」算法模型以 53.06 的出色成绩斩获端到端自动驾驶赛道第一名。近日，在全球权威的 ICCV 2025 自动驾驶国际挑战赛（Autonomous Grand Challenge）中，浪潮信息 AI 团队所提交的「 ...

澎湃新闻

让VLM学会“心中有世界”：VAGEN用多轮RL把视觉智能变成「世界模型」 ...

当今的 AI 智能体（Agent）越来越强大，尤其是像 VLM（视觉-语言模型）这样能「看懂」世界的智能体。但研究者发现一个大问题：相比于只处理文本的 LLM 智能体，VLM 智能体在面对复杂的视觉任务时，常常表现得像一个「莽撞的执行者」，而不是一个「深思熟虑 ...

中国日报网

Modula摩登纳Flexibox新品上海首秀，在CeMAT Asia 2025现场重塑仓储效率！

一年一度的亚太地区物流盛会——CeMAT ASIA 亚洲国际物流技术与运输系统展览会，将于2025年10月28日至31日在上海新国际博览中心再次启幕。作为物流装备领域的重要风向标，本届展会展示面积突破80,000平方米，预计将吸引超过900家国内外知名企业参展，并举办近 ...

logisticaprofesional

Sistemas de almacenaje para palés: del rack convencional al shuttle, el mapa actual en España

En un mercado cada vez más presionado por la falta de espacio disponible, el incremento de la rotación de inventarios y la necesidad de optimizar cada metro cúbico, la elección del sistema de ...

腾讯网

垂直升降货柜的智能进化：认识 Modula FLEXIBOX

在现代仓储物流的核心环节,垂直升降货柜(VLM)早已不是新鲜事物。它像一个高效的“垂直机器人”,利用升降平台在密集排列的垂直货道中精准存取货物,最大程度地利用仓库的立体空间,告别了传统货架需要大量通道的弊端。这种自动化存储方式显著提升了空间 ...

OFweek维科网

自动驾驶中常提的VLM是个啥？与VLA有什么区别？

自动驾驶车辆要在复杂多变的道路环境中安全行驶，不仅需要“看见”前方的车辆、行人和路面标志，还需要“读懂”交通标识上的文字提示、施工告示牌和乘客的语言指令。之前和大家讨论过VLA（相关阅读：自动驾驶中常提的VLA是个啥？），了解到视觉-语言 ...

IB资讯

小鹏G7 Ultra首发VLA+VLM大模型：智能座舱升级，重塑驾驶体验

小鹏汽车在小鹏G7 Ultra的上市发布会上，向公众揭晓了一项行业创新技术——本地端“VLA+VLM”大模型，该技术首次在小鹏G7 Ultra上得到应用。据悉，VLA大模型赋予了小鹏G7 Ultra主动思考与迅速决策的能力。它能够应对多种复杂的驾驶场景，例如，在遭遇交通拥堵 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果