OpenAI 于 2026 年年初开始研发“双向”架构,能够同时听和说,可以吸收用户的打断,并在对话中途实时调整。
报道指出 OpenAI 的文本模型已快速进化至 GPT-5.5,而语音功能仍停留在较旧的音频技术栈上,导致口语对话能力落后文字表现,而 GPT-Bidi-1 模型有望弥合这一差距。
该模型上线后,ChatGPT 用户可以根据需求切换双向模式和现有的高级语音模式,并支持 High、 Medium 以及 Instant 智能等级,方便用户根据任务调整速度和深度。
OpenAI 于 2026 年年初开始研发“双向”架构,能够同时听和说,可以吸收用户的打断,并在对话中途实时调整。
报道指出 OpenAI 的文本模型已快速进化至 GPT-5.5,而语音功能仍停留在较旧的音频技术栈上,导致口语对话能力落后文字表现,而 GPT-Bidi-1 模型有望弥合这一差距。
该模型上线后,ChatGPT 用户可以根据需求切换双向模式和现有的高级语音模式,并支持 High、 Medium 以及 Instant 智能等级,方便用户根据任务调整速度和深度。