帧率,可基于真人、动漫、萌宠等任意初始形象及个性化音色,快速创建专属交互角色。
路线,不再一次性生成完整,而是基于已经生成的历史画面,结合当前语音指令和对话上下文,持续预测并生成后续内容。当用户发出新的语音指令时,模型可以实时理解并调整角色的表情、动作及后续走向,使从预先确定的固定内容,转变为一个持续生成、实时响应、动态演化的交互过程。
帧率,可基于真人、动漫、萌宠等任意初始形象及个性化音色,快速创建专属交互角色。
路线,不再一次性生成完整,而是基于已经生成的历史画面,结合当前语音指令和对话上下文,持续预测并生成后续内容。当用户发出新的语音指令时,模型可以实时理解并调整角色的表情、动作及后续走向,使从预先确定的固定内容,转变为一个持续生成、实时响应、动态演化的交互过程。