新闻中心

具身智能:从“虚拟”迈入“现实”的关键一步

2025年,“人工智能×人形机器人”的概念高频亮相。今年全国两会上,“具身智能”作为未来产业的重要组成部分,首次被写入政府工作报告;3月,智能安检机器人在深圳地铁站上岗;4月,全球首个人形机器人马拉松比赛在北京开跑;不久后的8月,全球首个具身智能机器人4S店将在2025世界机器人大会期间与公众见面。具身智能拥有巨大的市场潜力,是各界公认的“蓝海产业”。《2025人形机器人与具身智能产业研究报告》预测,2025年我国具身智能市场规模将达52.95亿元,占全球的约27%;人形机器人市场规模将达82.39亿元,占全球的约50%。

围绕公众关心的具身智能热门话题,《人民邮电》报“聚焦”版策划小组与电信运营商具身智能项目相关负责人进行了一场对话……

问 什么是具身智能?应该从哪些方面来定义?

中国移动集团级首席专家 程宝平:

具身智能是“拥有物理身体,通过多模态感知与自主决策实现动态环境交互,并具备学习进化能力的智能实体”。它的本质是打破传统AI的虚拟边界,将智能“具象化”为可行动的实体,代表人工智能从“离身”向“具身”的范式跃迁。可以从自主交互、自主移动、自主作业、自主学习四个方面来定义。

中国电信人工智能研究院(TeleAI)科研副院长 张弛:

概括来说,具身智能是“人工智能”与“机器人学”的交叉领域。传统的机器人往往只能从事专属领域的单一工作,不具备泛化性,无法在开放环境中处理复杂任务。例如“扫地机器人”可以帮助人们清理地板,但也仅此而已。而具身智能则为机器人增加了更多AI、大模型的能力,为它赋予“智慧的脑”,让它能像人类一样思考,并在复杂环境中进行感知、决策和行动。

联通数字科技有限公司物联网事业部CTO 李凯:

具身智能是指通过物理世界的载体感知环境并实现交互的一体化全新智能范式。物理载体通过传感器等感知外部环境,数字空间人工智能大模型等实现认知、推理和决策升级,并通过多级算力协同与高性能通信网络构建数据高效、实时互动的桥梁,最终使得机器设备具备实时交互、自主认知等能力,实现机器设备的自我决策、操作及行动。机器人是具身智能的一种主要表现形式。

问 现在,AI大模型已经在社会运作、经济生产、群众生活的各个领域得到广泛应用,发挥了极大作用。在这样的背景下,我们为什么要进一步发展具身智能?

程宝平:

具身智能的突破性价值在于将人工智能从“数字认知”推向“物理行动”,打通“认知—行动—进化”全链路闭环,这一进化大大拓展了人工智能的应用边界,更在技术、产业、文化层面引发了链式变革。

从技术层面看,具身智能通过物理身体与环境实时交互,构建起“感知—决策—执行—反馈”的动态进化范式,让机器能够像人类一样通过试错积累经验,突破传统AI“知行割裂”与数据依赖的瓶颈。

从产业层面看,它是打造新质生产力的重要引擎,在极端制造领域替代高危人工,在老龄化领域实现劳动力支撑,推动实体经济向“智能体+”升级。

从文化层面看,具身智能推动着人机关系从“主从操控”迈向“共生共创”,重塑人类社会的生产与生活方式。

张弛:

当前,以大模型为核心的人工智能应用主要还停留在赛博空间,也就是虚拟世界中。例如我们命令大模型推荐一道菜,它可以生成菜谱和烹饪步骤,却无法真正把菜做出来。而具身智能技术则能够让AI能力从虚拟世界走向现实世界,成为打破次元壁的关键环节,它不仅可以理解我们的口味偏好,推荐详细的菜谱,还能直接烹饪好送到我们面前。有了具身智能,人工智能才能与我们生活的实际环境进行更深度的交互,创造更多的价值。

李凯:

具身智能有望成为人类社会继计算机、智能手机、新能源汽车后的颠覆性产品,是人工智能技术从数字世界走向物理世界的必然方向,将深刻变革我们的生产生活方式,重塑全球产业发展格局。

作为人工智能、移动通信、机器人等新兴产业的“集大成者”,具身智能融合数字世界与物理实体的典型特征,将催生人形机器人、智能汽车等新的产业增长点。另外,具身智能还为机器人等装备适应复杂作业环境、实现自主智能作业等提供了可行的技术路径,从而有效推动生产过程的降本、提质、增效。

我们认为具身智能发展的目标并不是取代人类,而是赋能人类。为实现这个目标,具身智能发展前期主要是增强人类在面对“三高”问题时的能力,即高危险性环境、高精确度操作和高重复性行为。

问 今年初,各地纷纷出台具身智能产业促进政策。具身智能当下面对的发展瓶颈有哪些?对于破除这些制约因素有何建议?

程宝平:

制约具身智能发展的瓶颈目前主要体现在三个方面。

一是底层技术体系仍不牢固,特别是在VLA大模型和通信能力两个关键环节存在明显短板。VLA大模型训练缺乏真实环境中连续交互、多模态融合的数据支撑,导致模型泛化能力弱、感知理解和自主决策水平有限。现有通信体系在时延控制、带宽保障和边缘计算能力等方面难以满足机器人高频感知、实时控制和多模态数据传输的需求,严重制约了闭环智能系统的构建和能力演进。

二是标准体系与评估机制滞后。不同类型的具身智能产品形态多样、接口分散,缺乏统一的功能定义、性能标准与测试评价体系,导致上下游协同效率低,产业生态碎片化,产品落地难以规模化、体系化推进。

三是高质量数据和真实场景资源供给不足。具身智能依赖大规模、多样化、连续交互的真实数据驱动模型优化,但目前场景部署尚浅,数据采集和更新机制不完善,无法有效支撑“训练—验证—迭代”的闭环流程。

破除上述制约因素,央地协同、政企联动是破题的关键抓手。全行业应当围绕技术短板集中攻关,加快构建适配多场景的VLA大模型训练机制,提升通信体系对实时感知与高效控制的支撑能力,夯实具身智能基础底座。加快制定具身智能领域的国家级基础标准与评测规范,推动从技术研发到产品准入的全过程标准化管理。联合产业链上下游企业,打造“具身智能超级训练场”,通过多企业、多设备、多任务协同运行,构建可采集、可复现、可闭环的数据环境,破解智能体训练和迭代的“数据孤岛”难题,加快推动具身智能从示范走向规模化。

张弛:

当前,具身智能的发展主要面临三个方面的难点和挑战,即数据、硬件和应用。

首先,用于具身智能训练的数据采集难度大、成本高、时间长,且泛化能力不强,导致不同产品之间无法实现训练数据共用共享。其次,具身智能的硬件水平有待进一步突破,当前材料学、机器人动力学等领域的科研成果尚不足以支撑具身智能达到与人类相当的运动水平。最后,作为一种新兴技术,具身智能需要进一步与应用场景适配,并发掘商业落地的可行路径,还需要产业各方共同探索。

为了进一步推动具身智能的创新和发展,在数据层面,可以尝试利用三维重建、视频生成等AIGC技术对物理世界进行建模,搭建用于机器人训练的高仿真环境,从而提升具身智能的训练效率,解决数据不足问题,并降低测试成本。在硬件层面,加强材料工程等相关基础学科的研发投入实现技术突破,并持续优化机器人的运动算法,实现高动态、复杂环境中的稳定运动控制。另外还需要加速具身智能的应用实践,率先在工业巡检、生产制造、家庭服务等场景快速落地,为进一步发展积累经验。

李凯:

具身智能还处于发展初期,在产业链、技术和市场发展方面均面临不同程度的挑战。

产业链的发展瓶颈在于应用场景和商业闭环。具身智能企业多停留在“研发—小批量试产—场景试点”阶段,尚未形成“研发—量产—销售—服务”的完整闭环。建议通过产业政策拉动场景,鼓励落地上量。

技术的发展瓶颈主要是高成本问题,例如,通用GPU难以满足实时运动控制需求,而机器人专用GPU主要以英伟达系列为主,受限于电池和散热条件,算力不高导致机器人的决策延迟。建议加强机器人专用GPU和专用大模型的自主研发,提高自主可控能力,降低软硬件成本。

市场的发展瓶颈主要是具备规模商用条件的成熟场景有限。建议在工业、商业服务以及特种等三类可突破场景,持续提升具身智能渗透率。

问 目前,运营商在具身智能的技术、产品、应用领域取得了哪些最新成果?未来能在哪些应用场景中发挥赋能作用?

程宝平:

中国移动具身智能产业创新中心将技术突破的核心聚焦于实现机器人的“四个自主”,即自主交互、自主出行、自主作业、自主学习,并不断夯实大模型、智算网络等关键数字底座。自2023年以来,我们以市场需求和技术驱动为双引擎,打造情感交互、自主出行、灵巧作业等特色功能,分阶段推出“能走—能说—能干活”的多形态机器人产品,已经打造出四足、轮式、轮臂、双足共4款机器人,在家庭、养老机构、展厅营业厅等多种场景试点落地。

张弛:

中国电信人工智能研究院正在着力进行人形机器人自研硬件相关工作,目前已经在国内首次研制出具有六个自由度的腰部关节,让机器人的运动更协调流畅。配合基于强化学习的上下肢对抗框架、动态平衡机制等技术,让机器人也可以实现类人的身体协调性和四肢灵活度,在复杂环境中完成奔跑、跳舞、回旋踢等动作。我们还将在近期推出机器人的全身遥操作系统,基于智传网(AI Flow)技术,实现远距离遥控,让机器人在复杂场景中远程作业,如工业巡检、生产制造,在高危环境、恶劣条件下替代人工等。

李凯:

联通数科基于自主研发的格物平台和元景大模型、5G+AI基础设施和属地化服务三大优势打造了网联机器人产品体系,通过“连接汇聚数据—数据训练智能—智能赋能场景”的闭环,形成了百种千型万机的机器人全生命周期管理与运营能力,为客户提供不同场景的端到端机器人解决方案。目前,我们正在努力锻造机器人的专精特新能力,特别是在电子零部件制造、化工与石化等场景中执行自主巡检、搬运、抓取等任务,在特定、复杂或危险环境中执行救援、作业等任务,在社区、商圈等环境中执行配送、解说等任务的能力。

问 “人工智能统治地球”是科幻电影的热门题材,这样的场景是否会成为现实?我们该如何应对具身智能技术潜在的安全隐患?

程宝平:

“人工智能统治地球”更像是科幻作品对未来的想象,目前并不具备现实基础。即便是具身智能这样前沿的人工智能形态,也仍处在技术探索和应用拓展阶段,距离真正具备独立意识和统治能力还有很长的路要走。

不过,公众的关注并非没有道理。具身智能的核心在于“智能+实体”的深度融合,机器人不仅能“思考”还能够“行动”,这让它们在社会生活、工业生产中的角色越来越重要。也正因为如此,它带来的潜在安全隐患,比如失控风险、数据泄露、算法偏见等问题,也值得我们高度重视。

中国移动始终坚持技术向善、安全可控的原则,在推动具身智能创新发展的同时,注重风险识别和防控。一方面,我们加强关键技术的自主研发,确保核心系统不被“卡脖子”。另一方面,我们也在积极参与具身智能领域的行业标准与监管规范制定,推动伦理审查机制嵌入技术研发全流程,确保技术发展始终在“可控边界”内运行。

总的来说,技术本身并不可怕,关键在于如何使用。全行业应该持续推动科技与安全并重、创新与治理并行,确保智能技术的发展始终服务于人类社会的整体利益。

张弛:

威胁人类的往往不是技术,而是人类自己。爱因斯坦曾说过:“技术本身没有道德性,使用技术的人的道德能力,决定了技术改变世界的方向和可能性。”

想要让AI、具身智能健康可持续发展,就需要打好治理的基础。目前,中国电信人工智能研究院已搭建起涉及多层级响应机制的AI治理平台。在基础层面,我们设置了多维度的评测基准和AI伦理评判标准,建立了“大模型安全高质量评估体系”,去度量人工智能的“对齐度”。面向具身智能的发展,我们希望让它以人类可解释、可理解的方式运行,做出符合人类价值观和伦理标准的决策和行动。

李凯:

人工智能向“统治”这样的自主意识方向演进,目前还看不到技术路径,有效的安全治理一定会随着技术演进而同步研究和完善。

当前具身智能潜在安全隐患主要是机器人本体安全,比如黑客控制机器人或操纵自动驾驶的车辆;机器人数据安全,比如训练数据被篡改后机器人无法正确识别人类和物体;人机交互安全,比如机器人误操作或执行指令异常而攻击人类。

产业链各方应当积极推动建立全球协同治理框架和行业安全标准体系,明确不同风险等级应用场景,比如医疗、军事为高风险的准入要求和操作规范。在技术方面强化保障机制,构建内生安全机制,加强机器人本体安全防护,防范网络攻击和非法控制,保障具身智能训练数据安全,提升人机交互的安全性和鲁棒性,避免误操作。

长期来看,未来将是人机共生的时代,应当在技术跃进的同时,推进有效的安全治理工作。中国联通凭借在物联网安全、数据安全、云原生安全等领域的深厚积累,将安全能力深度融入具身智能解决方案,为机器人的安全接入、可信数据传输、指令可靠执行构筑端到端防护壁垒。

距离开展 -