ChatGPT 目前很少不在新闻中,而它背后的工程师们正在定期为生成式AI聊天机器人推出新功能和改进——最近还包括新的语音和图像功能。
[ 相关: ChatGPT现在可以看到、听到并与部分用户对话 ]
简单来说,根据OpenAI的 博客文章,这些新功能意味着ChatGPT现在可以看、听和说话了。在与机器人互动时,您不再局限于 文本提示,尽管值得注意的是,这些功能目前仍然是ChatGPT Plus付费用户的专属。起初,只有少数用户在功能推出时获得了这些功能,但现在所有ChatGPT Plus用户都应该能够访问。(11月21日,ChatGPT的语音聊天功能 已向所有免费用户推出。)
除了改变您与ChatGPT互动的方式外,这些新功能还扩展了它的功能范围——例如,可以给您读睡前故事。以下是新功能以及如何最好地利用它们。
与ChatGPT聊天
如果您是ChatGPT Plus用户并想与ChatGPT对话,您需要使用 Android 和 iOS 的移动应用程序(此功能尚未添加到ChatGPT 网页版)。登录您的账户并进入主提示屏幕后,点击耳机图标(右下角)即可开始与机器人进行语音对话。
您会看到一个解释该功能作用的启动屏幕,然后您可以点击选择语音进行选择。有五种语音可供选择,如果您选择其中任何一种,您都会听到简短的预览。当您决定好要与哪种语音对话后,点击确认,然后您就可以开始说话了。
与ChatGPT说话就像与您的手机说话一样简单。当您停止说话时,应用程序会处理您说的话并生成响应。您会发现,当ChatGPT说话时,它常常会在响应结束时提出一个相关问题,以保持对话的进行——但您始终可以要求谈论其他事情,或点击左下角的暂停按钮开始新的聊天。
如果ChatGPT未能准确捕捉您所说的话,或者未能识别您说话时的停顿,您可以像使用对讲机一样,通过点击并按住屏幕来手动输入语音。说出您需要说的话,然后松开手指,聊天就会被处理——这是一种更刻意的交谈方式,您可能会觉得更容易。
考虑一下口头回复更好的一些方式:例如,您可以让ChatGPT给您讲个睡前故事,或者讲一个您选择主题的诗。与文本提示一样,您可以在主题或语气上尽可能具体。当您准备好返回ChatGPT主界面时,点击红色和白色的交叉图标,您将看到以文本格式显示的响应。
图像输入和输出
您现在可以使用图像来提示ChatGPT,无论是在 网页版 还是通过 Android 或 iOS 的应用程序。在网页版上,点击输入框左侧的回形针图标,然后从您的计算机中选择图像;在应用程序中,点击图片图标从您的相册中选择一张图片,或点击相机图标拍摄一张新照片(如果您看不到这些图标,请点击输入框左侧的+按钮)。
系统会邀请您在图像旁边添加提示,这里的选项几乎是无限的。例如,您可以询问ChatGPT图像中包含的内容。您也可以拍一张有问题的照片——比如一个漏水的龙头——然后询问如何最好地解决它,或者向ChatGPT展示冰箱里的物品,然后询问烹饪什么餐点的建议。
如果您使用的是移动应用程序,您可以在添加附带提示之前点击图像,并在图像的特定部分涂鸦——这会将ChatGPT的注意力集中在图像的某个特定部分,这对于解决问题或澄清特定内容非常有用。
图像生成器DALL-E(也由OpenAI开发)现在也集成在ChatGPT中。这意味着您可以要求生成新图像,以及使用您自己的图像作为提示:让它生成一个连绵起伏的山丘景观,或者一个肮脏的夜晚街景,或者一个室内场景的卡通风格渲染。您还可以要求它修改或扩展您提供的图像。
与文本提示一样,您越具体越好——您可以非常精确地描述图片中的内容、使用的风格以及颜色和阴影的应用方式。因此,您可以说您想看到一个卡通风格的图片,前景有一个水井。或者,您可能想要一位CEO型人物的写实肖像,以黑白渲染。如果您对第一个尝试不满意,您可以要求ChatGPT通过进一步的提示进行修改。要保存您的创作,请点击或点按生成的图像以找到下载选项。