在 OpenAI 春季发布会中该公司演示了 ChatGPT 的高级语音模式,这种语音模式是实时交互的,例如在 AI 进行说话时用户可以打断并继续补充内容,AI 也可以感知幽默或者讽刺等并做出回应。
与此前的 ChatGPT 语音功能最大的区别在于,此前的语音交互是先将语音转换为文本内容再发送给 AI,然后生成回复后 AI 再将其朗读出来,这个过程会增加交互的延迟时间。而高级语音模式不需要进行转换 (只是用户看不到转换过程),整个对话过程非常流畅并且交互延迟也比较低,高级语言模式也支持多模态可以调用摄像头实时识别内容。
目前只有少部分已经开通 ChatGPT Plus 的订阅用户可以受到邀请,OpenAI 将逐渐扩大该功能的使用范围,预计到秋季大部分 ChatGPT Plus 订阅用户都可以使用高级语音模式。
值得注意的是 OpenAI 还强调自从演示高级语音模式后,该公司一直在努力提高语音对话的安全性和质量,高级语音模式预设了四种声音,还添加了防止模仿名人声音的限制。
同时高级语音模式也同样存在各种安全限制,例如安全围栏功能会阻止对暴力或者版权内容的请求,即便用户进行诱导,AI 可能也会拒绝输出此类内容。
已经开通 ChatGPT Plus 的用户请检查自己的邮箱,如果收到高级语言功能的邀请,OpenAI 会发送一封电子邮件进行说明。
以上就是“OpenAI即日起开始向部分ChatGPT Plus订阅用户推出高级语音模式”的详细内容,想要了解更多IT圈内资讯欢迎持续关注编程学习网。
扫码二维码 获取免费视频学习资料
- 本文固定链接: http://phpxs.com/post/12352/
- 转载请注明:转载必须在正文中标注并保留原文链接
- 扫码: 扫上方二维码获取免费视频资料
查 看2022高级编程视频教程免费获取