学术研究

我校在人工智能顶会NeurIPS发表不确定性估计研究 | 聚焦人工智能可靠LLM机器人规划

来源:人工智能与大数据学院 文/尹世远 审校/朱春华 审核/樊超 2025-12-01 14:40 浏览:
摄影 审校 朱春华
审核 樊超 分类

近日,全球人工智能领域顶级学术会议NeurIPS 2025公布了论文录用结果。我校人工智能与大数据学院智能认知与决策控制团队以第一作者单位发表论文《Towards Reliable LLM-based Robot Planning via Combined Uncertainty Estimation》,第一作者为该团队尹世远博士,通讯作者为中国电信人工智能研究院白辰甲研究员。

NeurIPS(神经信息处理系统年会)2025将于今年12月在美国举行,NeurIPS是机器学习与计算神经科学领域的国际顶级学术会议,被中国计算机学会(CCF)推荐为A类国际学术会议。作为当前全球最负盛名的人工智能学术会议之一,在谷歌学术发布的全球学术期刊和会议影响力排名中位列前列,与ICML、ICLR并称为人工智能领域难度最大、水平最高、影响力最强的“三大会议”。这也是河南工业大学人工智能与大数据学院首次在NeurIPS顶会上发表论文。

该论文立足机器人规划领域,聚焦大型语言模型(LLMs)在机器人任务规划中的可靠性问题。LLMs虽能理解自然语言指令并生成高层计划,但存在幻觉现象,可能导致过度自信的不安全计划。论文针对现有研究未充分区分认知不确定性和内在不确定性的局限,提出了一种新型不确定性评估框架CURE(Combined Uncertainty estimation for Reliable Embodied planning),通过分解不确定性成分,提升规划可靠性。


CURE算法概览

CURE框架将认知不确定性细分为任务清晰度和任务熟悉度,分别基于随机网络蒸馏(RND)和多层感知机回归头进行评估;内在不确定性则建模为计划的预期成功率。该方法无需修改现有LLM规划器,即可实现即插即用的不确定性估计。在任务熟悉度评估环节,研究团队采用RND网络计算任务描述向量的相似度指标,从而量化任务熟悉程度。


CURE训练推理流程

河南工业大学人工智能与大数据学院智能认知与决策控制团队在我校特聘教授王震的带领下长期专注于人工智能、机器人规划与多模态学习研究,与中国电信人工智能研究院开展深入学术合作,在LLM与机器人系统集成方面具有深厚积累。未来,团队将继续聚焦大型语言模型在机器人任务规划中的不确定性估计、违规无人机识别与意图分析等核心挑战,推动原创性、引领性科技攻关,为推进学校“双一流”创建和人工智能学科发展贡献力量。

(责任编辑:鲁俊超)