资讯
你的模型真能举一反三吗 RoboChallenge Table30 V2 正式发布开启泛化时代
RoboChallenge Table30 V2 正式发布,作为全球首个大规模真机评测平台,旨在解决具身智能模型在真实场景中的泛化能力问题。通过任务升级、评测升级和系统升级,Table30 V2 引入了更严苛的软体操作、工具使用及双臂协作任务,支持零样本与域外泛化测试,为研究者提供精准的泛化能力评估工具。
13个传感器软手加持,康奈尔大学打造能看会摸采摘机器人登Nature子刊
康奈尔大学团队研发出全球首个集视觉、触觉与本体感知于一体的软体机器人手,配备13个传感器,可精准识别并采摘娇嫩草莓,实现‘看会摸’的智能采摘。该技术突破传统机器人在复杂光照下判断不准、易损果实的瓶颈,为农业自动化带来革命性进展,成果即将发表于《Nature Communications》。
世界模型走向轻量化?LeCun团队与清华团队提出两条路径
本文聚焦世界模型领域的两项前沿进展:Yann LeCun团队提出的LeWorldModel通过简化JEPA框架实现从像素端到端训练,大幅降低复杂度并验证物理结构编码能力;清华大学团队的Fast-WAM则挑战传统WAM范式,提出测试阶段无需显式未来想象的高效替代方案。两篇工作从不同角度推动世界模型向更简洁、高效演进,为具身智能发展提供新思路。
通义实验室发布PrismAudio:让AI听懂视频实现智能配音告别声画分离
阿里通义实验室发布全新视频生成音频框架PrismAudio,通过引入思维链与多维度强化学习评估,实现声音与画面的精准同步,解决AI配音中‘声画两张皮’难题。9秒视频仅需0.63秒生成高质量环境音效,轻量高效,已入选ICLR2026,推动影视创作进入‘所见即所闻’的真音时代。
全球首款全自主人形机器人亮相 网球对打惊艳世界
全球首个实现自主网球对打的人形机器人问世!银河通用联合清华大学发布全新算法LATENT,突破人形机器人在高动态对抗场景中的实时决策与运动控制难题。无需预编程,机器人通过学习碎片化人类动作,在真实比赛中完成连续多回合击球,展现类人智能与敏捷运动能力。该技术标志着机器人从‘机械复刻’迈向‘智能响应’的关键跨越,引发马斯克、AI专家热议。
智能内裤监测放屁 科学家建人类放屁图谱
科学家发明了一款「智能内裤」,用于监测人体放屁情况,颠覆了传统医学认知。研究发现健康成年人平均每天放屁32次,远超过去的10-20次预期。这款设备通过传感器实时监测氢气含量,计划建立「人类放屁图谱」,已有3500人排队参与研究。
T-RO研究:机器人传感器阵列减半精度反升
曼彻斯特大学与港中文团队在T-RO发表新研究,提出柔性机器人传感器布局的端到端协同优化方法。通过联合优化传感器位置、数量与形变预测网络,实现‘减半传感器数量但精度更高’的反直觉效果。研究将制造约束融入优化过程,真正解决从仿真到落地的工程难题,为软体机器人与可穿戴设备设计提供新范式。
92%成功率!通研院创新性学习框架登《Science Robotics》,首次实现异构机器人“心领神会”打配合
北京通用人工智能研究院联合多家机构在《Science Robotics》发表突破性成果,提出「意图对齐模仿学习」(IAIL)框架,首次实现七类异构机器人在无明确指令下自主理解意图、自适应协作。实验中92%成功率完成30个多步任务,推动机器人跨形态协同迈向新高度。
港理工研发370克双足跳机器人 可跃过6.9米高墙 落点精度达3.8毫米
香港理工大学团队研发的GravOff双足机器人通过旋翼制造局部低重力环境,实现6.9米高跳跃和3.8毫米精准落点,颠覆传统跳跃机器人设计。该机器人结合推力矢量控制和主动阻尼技术,在复杂环境中表现出色,为机器人运动控制带来新突破。
英伟达布局数据生态与灵巧手 欲终结夹爪时代
英伟达近期通过DreamZero、SONIC与EgoScale三大开源模型,构建起从世界模型到运控再到灵巧操作的‘三位一体’布局,推动具身智能迈向数据驱动的新范式。文章深度解析其技术突破与生态战略,探讨灵巧手如何终结夹爪时代,并揭示未来人形机器人发展的核心趋势。
Nature子刊:百万次弯折不坏 可降解机器人问世
科学家研发出可生物降解的机器人手指,性能卓越且环保,能在工业堆肥条件下完全分解。这款机器人不仅耐用(100万次弯折不坏),还集成了21种传感器,适用于农业监测等场景,真正实现高性能与可持续性的完美结合。
国防科大研发1.2克纸折机器人 奔跑距离达17倍身长登顶刊
国防科技大学团队研发的1.2克折纸机器人PLioBot登上《Nature》子刊,这款微型机器人采用一体化集成制造技术,能在复杂地形中高速移动,每秒可跑17.8倍身长,还能负重游泳和钻过狭窄空间,展现了微型机器人技术的重大突破。
国产大模型M2.7发布 首创深度自我迭代能力
人工智能的进化速度,正在从“月更”向“自进化”跨越。3 月 18 日,MiniMax正式发布了其首个深度参与迭代自身的新版本模型——MiniMax M2.7。这标志着模型开发进入了一个新阶段:大模型不再仅仅由人类程序员喂养,而是开始学会“自己带自己”。据介绍,MiniMax M2.7的核心突破在于其极强的自主构建能力。它能够自行构建复杂的 Agent Harness(智能体测试框架),并依托 Ag...
化学AI领域新突破!清华AIR联合水木分子开源“BioMedGPT-Mol”通用大模型
在人工智能与生物医药交叉的前沿阵地,国产大模型正加速从“通用对话”迈向“专业深耕”。近日,清华大学智能产业研究院(AIR)联合水木分子,正式开源了名为 BioMedGPT-Mol 的化学分子通用基座模型。这一动作标志着科研机构与创新企业在推动药物研发智能化、标准化方面迈出了关键一步。作为一款专为化学分子设计的“大语言模型”,BioMedGPT-Mol 的核心价值在于其通用的表征能力。不同于传统的碎...
苹果LiTo大模型问世 单图秒转3D 光影还原提升37%
苹果AI研究团队推出LiTo大模型,通过创新技术实现单张平面图像生成高保真3D对象,光影还原度提升37%。该模型采用潜在空间和统一3D表示法,解决了3D重建领域的长期难题,为AR和空间计算设备提供高质量素材支持。