洞察财经脉动 · 引领数码未来

科金社 - 连接财经智慧与科技创新的专业资讯平台

机器人看懂视频,练就超逼真唇形动作

机器人开口说话,唇形逼真到以假乱真

科金社2026年01月19日 22:40消息,机器人通过观看视频学习超逼真嘴部动作,突破传统僵硬模式。

   1月19日,据消息称,在哥伦比亚大学的一间工程实验室中,一款人形机器人已经能够以前所未有的真实度进行嘴唇的活动。这项由创意机器实验室(CreativeMachinesLab)主导的研究首次实现了自主系统仅通过视觉学习,就掌握了用于说话和唱歌的自然唇部动作。

   据了解,这一成果突破了人形机器人设计领域的一个关键难题:面部动作的不协调感。虽然机器人在行走、抓取以及整体灵活性方面已取得显著进展,但面部表情,特别是与语言相关的唇部动作,仍是一个尚未解决的挑战。

   即便是顶尖的人形机器人,其嘴部动作仍常显得僵硬,仿佛木偶般缺乏自然感,难以达到真实生动的效果。人类对于这种细微的不协调感极为敏感,这种心理反应正是研究人员所指出的“恐怖谷效应”的重要成因之一。 在技术不断进步的今天,人形机器人的外观与动作虽已日趋逼真,但在表情与微表情的表达上仍存在明显短板。尤其是嘴部的运动,往往无法准确匹配语音节奏与情感变化,导致整体表现缺乏真实感。这种不协调不仅影响用户体验,也可能引发观众的不适感,进一步加深“恐怖谷效应”的影响。因此,提升人形机器人在面部表情和语言同步方面的自然度,仍是当前研发中的关键挑战。

   该研究团队采用了一种全新的学习方法,机器人没有依赖为每个元音或音素设定的固定规则,而是通过实验和模仿来掌握唇部力学。其面部由覆盖在26个微型马达上的柔性合成皮肤构成,能够精准复刻语言表达中细微的肌肉运动变化。 这项技术突破展示了人工智能在模拟人类语言表达方面的巨大潜力。传统的语音生成方式往往依赖于预设规则,而这种基于实验和模仿的学习方式,更贴近人类自然的习得过程。未来,这种技术有望在虚拟助手、语言康复训练等领域发挥重要作用。同时,它也引发了对机器是否能真正“理解”语言的思考——即使它们能精确复制外在表现,内在的语义与情感是否仍属人类独有的领域?

   研究人员首先让机器人面对镜子,使其观察自身数千种随机表情。通过这一过程,机器人掌握了马达运动与不同面部形态之间的对应关系,研究人员将这一阶段称为“自我探索期”。

   在理解自身运动机制之后,机器人开始学习人类的语言表达方式。它通过分析大量的人类说话和歌唱视频素材(来源于YouTube),建立了唇部动作与声音之间的统计学联系。这一被称为“视觉-动作转换模型”的训练过程,使得系统能够直接将音频信号转化为同步的电机控制指令,无需依赖传统的语音编程,即可生成真实的唇部动作。

   测试结果显示,这款机器人能够配合多种语言完成唇部同步运动,甚至还能演唱其人工智能原创专辑《Hello World》中的曲目。尽管目前的动作仍非尽善尽美,如“B”这类爆破辅音,以及“W”这类噘唇音的模仿,仍是待解难题,但进步效果显而易见。创意机器实验室主任、机械工程学教授霍德 · 利普森表示:“它与人类的互动越频繁,表现就会越出色。”

   这项突破的意义远不止于娱乐领域,更触及人机交流的深层次发展。能够传递细腻情感的机器人面部,或将彻底重塑人机互动的方式。研究负责人胡宇航(Yuhang Hu,音译)指出,将逼真的面部动作与ChatGPT、Gemini等对话式人工智能相结合,有助于增强人机交互中的情感共鸣,使“彼此理解”的感觉更加真实。随着模型在更丰富、更长的对话语境中不断学习,这些微表情也将具备更强的情境感知能力。 从技术发展的角度来看,这一进展标志着人工智能在模拟人类情感表达方面迈出了关键一步。未来,这类技术有望在客服、教育、医疗等多个领域发挥作用,提升人机互动的自然度和亲和力。不过,也需关注其可能带来的伦理与社会影响,例如人们对虚拟角色的情感依赖是否会影响真实人际关系的建立。

   利普森认为,这类研究填补了机器人技术中一个长期被忽视的维度。他解释道,目前大多数关于人形机器人的研究都集中在肢体的机械性能上,比如腿部、手部的动作与移动能力,而忽略了面部情感表达的重要性。然而,在教育、医疗和养老等应用场景中,逼真的面部表情与实用的肢体灵活性同样关键。随着全球人形机器人量产进程加快(部分经济学家预测,十年内产量将达数十亿台),面部动作的逼真度或将成为影响公众接受度的重要因素。 我认为,这一研究方向的提出非常及时且具有前瞻性。在人机交互日益频繁的今天,机器人不仅需要具备强大的功能性,更应具备与人类沟通的情感能力。未来,随着技术的进步,机器人在社会中的角色将更加多元化,而情感表达能力的提升,无疑会增强其与人类之间的互动体验,也更有利于推动其在更多领域的广泛应用。

   胡宇航表示:我们正接近跨越恐怖谷的临界点。未来的人形机器人,势必会具备灵活自然的面部表情。

   不过,胡宇航和利普森都表示,这项技术背后隐藏着复杂的心理学和伦理问题。随着机器人越来越具有人性特征,人与机器之间的情感界限可能变得模糊。长期研究机器人共情能力的利普森呼吁保持谨慎态度:“我们必须稳步推进、小心探索,才能在享受技术带来的好处的同时,将潜在风险控制到最低。”

   该研究成果已发表于《科学 · 机器人学》期刊。

留言评论

(已有 0 条评论)
请输入您的姓名
请输入有效的邮箱地址
请输入评论内容

暂无评论,成为第一个评论者吧!

特别推荐
AI平板杀出黑马!联想逆势狂涨300%,撬动存量红海变增长蓝海
2025-12-25 13:00
英伟达估值被低估?投行:现在入场正当时!
2025-12-25 12:57
人形机器人巅峰对决:Optimus 遇战 Atlas,CES 2026 或掀科技风暴
2025-12-22 15:46
浙江余杭打造首所机器人学校 引领未来教育新潮流
2025-12-22 15:31
腾讯AI架构大变革!前OpenAI核心科学家空降,出任首席AI科学家引领大模型新纪元
2025-12-17 18:42
腾讯大模型团队重组,高薪抢夺AI顶尖人才
2025-12-17 16:57
实测震撼!18.7万台三星洗衣机集体开智:AI节能模式狂省30%电量,行业节能新拐点来了
2025-12-15 15:54
马斯克再放核聚变争议炸弹:转向太阳能AI卫星,年部署百GW新蓝图
2025-12-15 15:47
中移互联网联手支付宝华为,通话也能秒变AI服务新场景
2025-12-13 14:41
谷歌AI上线:一张自拍,轻松穿遍全球新衣
2025-12-13 14:41
马斯克VS王兴:2025全球AI权力榜TOP10震撼揭晓!中美科技领袖巅峰对决
2025-12-13 14:34
智造未来!湾区AI工厂加速跑出加速度
2025-12-13 14:31
甲骨文重磅调整:OpenAI数据中心项目延至2028年引爆行业热议
2025-12-13 14:30
GPT-5.2惊现?性能已超Gemini 3引热议
2025-12-11 15:17
AI狂潮席卷华尔街:银行生产力飙升300%,柜员与信贷岗铁饭碗开始松动
2025-12-10 14:29
AI眼镜赛道战火升级 投资风口悄然崛起
2025-12-10 14:24
瑞芯微携手宇树科技、云深处科技,共探人形机器人新未来
2025-12-08 18:53
豆包手机助手:银行卡余额查询新突破,用户授权成关键
2025-12-06 21:41
天风证券再推买入强音,英伟达股价或迎新风口
2025-12-06 21:33
OpenAI 强悍编程模型 API 上线,代码编写时长突破 24 小时大关
2025-12-05 15:37
战略联盟

友情链接 - 合作伙伴网络

携手顶尖科技平台 共建数字生态

网暻网络

www.wjwl666.top

访问网站

科技快讯

news9999.cn

访问网站

文化潮流网

www.kouc.cn

访问网站

量子财讯

www.360shoulu.com

访问网站

友情链接持续增加中,期待与更多优秀平台建立友情链接