智东西1月27日报道,刚刚,DeepSeek开源了其面向OCR场景的专用模型DeepSeek-OCR 2,技术报告同步发布。这一模型是对去年DeepSeek-OCR模型的升级,其采用的新型解码器让模型看图、读文件的顺序更像人,而不是像机械的扫描仪。 简单来说,以前的模型阅读模式是从 ...
CLOiD, el robot doméstico de LG, inaugura una nueva era de inteligencia artificial y modularidad en la vida cotidiana - crédito Fotomontaje Infobae (Steve Marcus/LG) El CES 2026 abrió sus puertas en ...
视觉语言模型(VLM)是同时处理图像和文本的人工智能系统。它们连接了计算机视觉(理解视觉数据的人工智能)与自然语言处理(理解语言的人工智能)。2025年最具影响力的十大视觉语言模型(VLM)的更深入概述,解释它们在不同用例中的差异——涵盖视频 ...
近日,在全球权威的 ICCV 2025 自动驾驶国际挑战赛(Autonomous Grand Challenge)中,浪潮信息 AI 团队所提交的“SimpleVSF”(Simple VLM-Scoring Fusion)算法模型以 53.06 的出色成绩斩获端到端自动驾驶赛道(NAVSIM v2 End-to-End Driving Challenge)第一名。 SimpleVSF ...
近日,在全球权威的 ICCV 2025 自动驾驶国际挑战赛中,浪潮信息 AI 团队所提交的「SimpleVSF」算法模型以 53.06 的出色成绩斩获端到端自动驾驶赛道第一名。 近日,在全球权威的 ICCV 2025 自动驾驶国际挑战赛(Autonomous Grand Challenge)中,浪潮信息 AI 团队所提交的「 ...
当今的 AI 智能体(Agent)越来越强大,尤其是像 VLM(视觉-语言模型)这样能「看懂」世界的智能体。但研究者发现一个大问题:相比于只处理文本的 LLM 智能体,VLM 智能体在面对复杂的视觉任务时,常常表现得像一个「莽撞的执行者」,而不是一个「深思熟虑 ...
一年一度的亚太地区物流盛会——CeMAT ASIA 亚洲国际物流技术与运输系统展览会 ,将于2025年10月28日至31日在上海新国际博览中心再次启幕。作为物流装备领域的重要风向标,本届展会展示面积突破80,000平方米,预计将吸引超过900家国内外知名企业参展,并举办近 ...
En un mercado cada vez más presionado por la falta de espacio disponible, el incremento de la rotación de inventarios y la necesidad de optimizar cada metro cúbico, la elección del sistema de ...
在现代仓储物流的核心环节,垂直升降货柜(VLM)早已不是新鲜事物。它像一个高效的“垂直机器人”,利用升降平台在密集排列的垂直货道中精准存取货物,最大程度地利用仓库的立体空间,告别了传统货架需要大量通道的弊端。这种自动化存储方式显著提升了空间 ...
自动驾驶车辆要在复杂多变的道路环境中安全行驶,不仅需要“看见”前方的车辆、行人和路面标志,还需要“读懂”交通标识上的文字提示、施工告示牌和乘客的语言指令。之前和大家讨论过VLA(相关阅读:自动驾驶中常提的VLA是个啥?),了解到视觉-语言 ...
小鹏汽车在小鹏G7 Ultra的上市发布会上,向公众揭晓了一项行业创新技术——本地端“VLA+VLM”大模型,该技术首次在小鹏G7 Ultra上得到应用。 据悉,VLA大模型赋予了小鹏G7 Ultra主动思考与迅速决策的能力。它能够应对多种复杂的驾驶场景,例如,在遭遇交通拥堵 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果