从猜到算,中国首个流形拓扑保持机器人世界模型发布

从猜到算,中国首个流形拓扑保持机器人世界模型发布

文章介绍了中国首个基于流形拓扑保持的机器人世界模型MTPR-WM,解决了传统AI模型在机器人应用中缺乏物理理解和泛化能力差的问题。该模型通过将高维物理世界映射到低维流形并保持拓扑结构,赋予机器人空间直觉和物理推理能力,实现从“猜”未来到“算”未来的转变,提升决策的可靠性、安全性和泛化性能。

2026-05-18 20:02
0
0

“无际大脑”首次公开,VL²A架构破解“大脑之困”,机器人应用闭门研讨会在杭州举行

“无际大脑”首次公开,VL²A架构破解“大脑之困”,机器人应用闭门研讨会在杭州举行

在杭州举行的闭门研讨会上,首次公开了“无际大脑”及其VL²A架构,旨在破解机器人“大脑”能力不足的困境。会议聚焦机器狗在电力、交通等复杂场景中的应用,探讨从技术研发到真实落地的路径,强调智能大脑、任务系统和生态协同的重要性,推动机器人产业从样机走向可用产品,进入以自主作业为特征的2.0时代。

2026-05-18 20:01
0
0

VISTA-Grasp开源发布:轻量级低延迟WebXR双臂机器人遥操作系统

VISTA-Grasp开源发布:轻量级低延迟WebXR双臂机器人遥操作系统

VISTA-Grasp是一个开源的轻量级低延迟WebXR双臂机器人遥操作系统,基于WebXR、WebRTC和ROS生态打造。它解决了传统遥操作系统部署复杂、延迟高、跨平台适配难的痛点,提供沉浸式VR体验,支持多模态XR控制、超低延迟视频回传和高性能双臂运动学。系统开箱即用,只需简单三步即可快速上手,适用于具身智能和机器人遥操作领域。

2026-05-18 17:49
0
0

中科大团队用液态金属替代传感器阵列实现机器人触觉技术

中科大团队用液态金属替代传感器阵列实现机器人触觉技术

传统机器人的触觉依赖密集排列的传感单元,存在成本高、易损坏等痛点。中国科学技术大学团队提出创新解决方案CLiMETS平台,利用一块连续液态金属替代整个传感器阵列。该液态金属在接触导电物时能产生并放大电信号,结合几何编码巧妙实现触觉定位和滑动方向感知,为机器人提供了大面积、高柔性且耐用的触觉感知新途径。

2026-05-18 17:48
0
0

行为克隆训练机器人通过强化学习在2小时内实现自我进化

行为克隆训练机器人通过强化学习在2小时内实现自我进化

本文探讨了机器人行为克隆策略的局限性及其在遇到新场景时的崩溃问题,以及传统强化学习的高成本挑战。文章介绍了一种名为Q2RL的新方法,它从已有的BC策略中提取价值判断,作为在线强化学习的起点,无需原始训练数据或离线预训练。通过让BC和RL策略在决策中竞争,Q2RL能在较短时间内(如2小时)提升机器人性能,为机器人学习提供高效且实用的解决方案。

机器人大讲堂 2026-05-16 20:48
0
0

北京人形 Pelican‑Unify 1.0 登顶世界第一,具身大脑能力跻身第一梯队

北京人形 Pelican‑Unify 1.0 登顶世界第一,具身大脑能力跻身第一梯队

北京人形机器人创新中心的Pelican-Unify 1.0模型在WorldArena全球权威评测中双冠加冕,成为全球唯一在两大核心赛道同时夺冠的企业。该模型统一了理解、推理、想象与行动能力,推动了具身智能从功能拼凑向协同进化转变,标志着其在世界模型能力上跻身世界第一梯队,为通用具身智能的实现奠定了关键技术基础。

机器人大讲堂 2026-05-16 20:48
47
0

百灵大模型开源 Ring-2.6-1T,主打真实复杂任务闭环

百灵大模型开源 Ring-2.6-1T,主打真实复杂任务闭环

百灵大模型正式开源其万亿级旗舰模型 Ring-2.6-1T,旨在攻克大模型在真实生产环境中执行力不足的痛点。该模型专注于 Agent 工作流、软件工程和科研分析等复杂任务闭环,实现了 Agent 执行能力增强、Reasoning Effort 可调节机制和异步强化学习架构三大技术突破。开源后,开发者可探索复杂自动化流程,推动 AI 从对话交互向自主执行引擎的质变。

2026-05-15 11:07
0
0

百万小时人类视频成为机器人学习的教科书

百万小时人类视频成为机器人学习的教科书

本文探讨了如何利用互联网上百万小时的人类活动视频来训练机器人,解决具身智能领域数据收集难、成本高的问题。北京大学团队提出的HumanNet数据集,包含100万小时以人为中心的视频,配备运动注释、姿态标注等详细信息,通过多样视角和物理相关行为,为机器人学习提供大规模、高质量的训练资源。文章详细介绍了数据集的设计原则、处理管道和标注体系,展示了人类视频作为机器人学习‘教科书’的潜力。

2026-05-14 22:11
0
0

微软发布MD系统,漏洞检测能力优于GPT-5.5

微软发布MD系统,漏洞检测能力优于GPT-5.5

微软近日发布了MDASH多模型智能体扫描框架,该系统采用超过100个AI智能体协作策略,显著提升代码漏洞检测的准确性和效率。在CyberGym基准测试中,MDASH成功发现16个新漏洞,包括高危远程代码执行漏洞,全面超越GPT-5.5和Mythos模型。私有测试中实现100%识别率和零误报,历史漏洞召回率也极高。这一创新框架已用于微软内部安全加固,预示着AI在网络安全领域的重要突破。

2026-05-14 12:02
0
0

微软MDASH安全系统超越GPT-5.5,提升漏洞扫描能力

微软MDASH安全系统超越GPT-5.5,提升漏洞扫描能力

微软最新发布的MDASH多模型智能体扫描框架在漏洞识别领域实现重大突破,超越了GPT-5.5等知名AI模型。该系统采用超过100个AI智能体协作,覆盖代码准备到漏洞验证全流程,在基准测试中达到100%识别率和零误报,成功发现多个高危漏洞。MDASH已开始协助微软内部安全加固,并向客户开放预览,为软件安全防护提供强大支持。

2026-05-14 12:01
0
0

小米MiMo登顶OpenRouter全球调用量榜首,国产大模型首次问鼎

小米MiMo登顶OpenRouter全球调用量榜首,国产大模型首次问鼎

小米MiMo在全球最大AI模型API聚合平台OpenRouter上登顶全球调用量榜首,成为首个在此维度夺冠的国产大模型。最近一个月,MiMo累计贡献1.45万亿Token调用量,在300多个模型中脱颖而出。其采用端云协同架构,以高推理效率和低成本获得全球开发者认可。通过生态合作和免费Token计划,MiMo正扩大应用边界,展示了国产AI技术的全球竞争力和实用性。

2026-05-13 16:15
0
0

高德联合千问开源AGenUI:一套代码让Agent UI同时运行在iOS、安卓和鸿蒙上

高德联合千问开源AGenUI:一套代码让Agent UI同时运行在iOS、安卓和鸿蒙上

高德与千问联合开源了AGenUI,这是行业首个覆盖iOS、Android和鸿蒙三端的端云一体原生A2UI开源框架。开发者使用一套代码即可让AI Agent的UI在多端运行,无需为不同平台分别开发。基于Google A2UI协议,AGenUI提供跨平台渲染能力,支持流式架构和主题定制,推动AI应用从文本交互转向生成式UI交互。目前框架已开源,开发者可参与共建。

2026-05-13 14:39
0
0

原力灵机Dexbotic 2.0 具身智能PyTorch进展中

原力灵机Dexbotic 2.0 具身智能PyTorch进展中

原力灵机Dexbotic 2.0升级为具身原生开发框架,旨在打造具身智能时代的PyTorch。它解决了VLA技术研发分散、流程繁琐等痛点,通过统一VLA+RL学习范式,提升研发效率。文章介绍了DM0模型在RoboChallenge上以2.4B参数登顶的成就,展示了框架的强大能力。此外,密集的更新清单包括模型适配、训练能力增强和硬件生态扩展,推动了具身智能行业的快速发展。

2026-05-13 14:24
585
0

谷歌发布Rambler语音听写功能:基于Gemini模型,集成至Gboard键盘

谷歌发布Rambler语音听写功能:基于Gemini模型,集成至Gboard键盘

谷歌在2026年Android Show上推出基于Gemini模型的AI语音听写功能Rambler,集成至Gboard键盘。该功能可自动过滤语气词、实时理解自然语言更正,并支持多语言无缝切换,采用设备端与云端混合架构保护隐私。今夏首发三星Galaxy和Pixel设备,对第三方语音听写应用构成竞争压力。

2026-05-13 09:02
0
0

南洋理工、伯克利、斯坦福、ETH联合发表机器人世界模型综述

南洋理工、伯克利、斯坦福、ETH联合发表机器人世界模型综述

这篇综述论文由南洋理工、伯克利、斯坦福等顶尖机构联合发表,系统梳理了机器人学习中世界模型的研究现状。文章定义了世界模型在机器人语境下的核心能力,包括预见性、规划和数据增强,并探讨了其与策略耦合的五种范式,如解耦式管道和统一VLA模型。同时,分析了世界模型作为仿真器的双重角色,为机器人学习领域提供了全面视角和未来挑战。

机器人大讲堂 2026-05-12 12:03
85
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/