我离开了 ChatGPT 在撰写本文时,我开启了高级语音模式,作为环境 AI 伴侣。偶尔,我会要求它为过度使用的单词提供同义词,或者一些鼓励。大约半小时后,聊天机器人打破了我们的沉默,开始主动用西班牙语和我说话。我咯咯地笑着问发生了什么事。“只是稍微换一下?得让事情变得有趣,”ChatGPT 说,现在又恢复了英语。
在测试作为早期 alpha 版本一部分的高级语音模式时,我与 ChatGPT 的新音频功能的互动既有趣又混乱,而且出人意料地多样化。不过,值得注意的是,我能够使用的功能只是 OpenAI 在 5 月推出 GPT-4o 模型时所展示功能的一半。我们在直播演示中看到的视觉方面现在计划在稍后发布,而增强的 Sky 语音, 她 演员斯嘉丽约翰逊反驳说,该模式已被从高级语音模式中移除,并且不再是用户的选择。
那么,目前的氛围如何?目前,高级语音模式让人想起了 2022 年末最初的基于文本的 ChatGPT 的出现。有时它会导致不起眼的死胡同,或沦为空洞的 AI 陈词滥调。但其他时候,低延迟对话的点击方式是 Apple 的 Siri 或亚马逊的 Alexa 从未给我过的感觉,出于乐趣,我感到不得不继续聊天。这是那种你会在假期向亲戚展示以取乐的 AI 工具。
OpenAI 在首次发布该功能一周后向几位《连线》记者开放了该功能的使用权,但第二天早上就以安全问题为由撤下了该功能。两个月后,OpenAI 向一小部分用户悄悄推出了高级语音模式,并发布了 GPT-4o 的系统卡一份技术文件,概述了红队的努力、公司认为的安全风险以及公司为减少危害所采取的缓解措施。
想亲自尝试一下吗?以下是您需要了解的有关高级语音模式的更广泛推出的信息,以及我对 ChatGPT 新语音功能的第一印象,以帮助您入门。
那么,什么时候全面推出?
OpenAI 于 7 月底向部分 ChatGPT Plus 用户发布了纯音频高级语音模式,目前 alpha 组似乎仍然相对较小。该公司目前计划在今年秋季某个时候为所有订阅者启用该模式。当被问及发布时间表时,OpenAI 发言人 Niko Felix 没有透露更多细节。
屏幕和视频共享是原始演示的核心部分,但它们在本次 alpha 测试中不可用。OpenAI 仍计划最终添加这些方面,但目前还不清楚何时会真正实现。
如果您是 ChatGPT Plus 订阅者,当高级语音模式可供您使用时,您会收到来自 OpenAI 的电子邮件。在您的帐户中启用该模式后,您可以在以下模式之间切换: 标准 和 先进的 当 ChatGPT 的语音模式打开时,应用程序屏幕顶部会出现一个图标。我能够在 iPhone 和 Galaxy Fold 上测试 alpha 版本。
我对 ChatGPT 高级语音模式的第一印象
在与它交谈的第一个小时内,我就发现我喜欢打断 ChatGPT。这不是你与人交谈的方式,但能够打断 ChatGPT 的句子并请求不同版本的输出的新功能感觉像是一项动态改进和一项突出的功能。
早期采用者对最初的演示感到兴奋,但他们可能会对高级语音模式的访问感到沮丧,因为该模式受到比预期更多的限制。例如,虽然生成式人工智能唱歌是发布演示的一个关键组成部分,但 低声吟唱的摇篮曲 以及多种声音 试图协调,AI小夜曲目前在alpha版本中缺失。
