春晚机械人集体“开窍”幕后大佬终究浮出水面
发布日期:2026-02-21 09:39 点击:
第一次看春晚机械人节目时,我的留意力全正在它们会不会摔倒上。本年竟然能打醉拳、能接梗、能仿照蔡明措辞——这前进速度,堪比火箭。
后来打听才晓得,台上所无机器人的言语能力都来自统一家公司:火山引擎。精确说,是火山引擎的豆包大模子。蔡明和王天放阿谁小品,机械人是副角。它得听懂蔡明的讥讽,接得上王天放的负担,还得正在环节时辰用蔡明的声音措辞逗乐不雅众。这套流程拆开来,每一步都是硬骨头。
豆包语音合成模子干的就是这个。它不是背台词,是及时阐发对话,生成合适的回应,让机械人说蔡明的台词时,能仿照蔡明的声线、节拍、以至那股标记性的平铺直叙。这种能力从哪来?正在对话式合成的下,豆包语音合成模子的理解范畴从「给定文本」扩大到「多轮对话」,让具身机械人们和智能硬件等产物“学会”了人类交换里的潜台词、搁浅、反讽。不是简单替代环节词,是实懂语境。《武BOT》节目里,宇树机械人没措辞,全程打拳,但这家厂商的机型暗里“很健谈”。宇树和火山引擎的合做,狂言语模子、视觉言语模子全套搬进了机械人身体。这意味着这台机械人正在展厅里能当员,正在家里能当保姆,正在工场能当巡检员。以前这些能力分离正在分歧系统里,现正在被大模子同一安排。把这些合做推到公共面前。但实正的故事发生正在舞台之外——当手艺从Demo变成量产,从表演变成办事,才是查验成色的时辰。至多目前,列队上车的公司越来越多,申明这条看起来是通的。手艺底座曾经铺好,剩下的就是成本和场景打磨了。查看更多。


