体验ChatGPT图像对话功能

in #cn3 years ago

OpenAI前天宣布,将在未来一二周内逐步向Plus用户和企业用户开放多多模态功能。我还没有获得语音对话能力,但是已经有了图像对话功能。迫不及待的进行了测试和体验。有惊喜也有失望。

ChatGPT图像对话功能概览

新的图像对话功能允许用户上传图片,AI能够识别并回应图像内容。这意味着Chatgpt有了“眼睛”,和用户的对话不再仅仅受限于文字,而是可以通过图像与人类进行更加丰富的沟通。

如何运用图像对话功能

图像描述与解释

用户上传图片后,ChatGPT可以为其提供描述或解释图中的内容。

image.png

教育学习辅助

学生可以上传与学习相关的图表或示意图,AI提供相关解读,帮助学生更好理解学习内容。

image.png

日常生活咨询

例如,上传某一物品或食材的图片,获取其名称、用途或食谱建议。

艺术和创意反馈

艺术家或设计师上传作品,获取AI的建议或反馈。

图像文案

你可以让 ChatGPT 为你想要在社交媒体或其他地方分享的图片生成一个描述性或幽默的文案。例如,你可以上传一张你和你宠物的自拍,并让 ChatGPT 为它想出一个机智的文案。
image.png

图像评论

你可以让 ChatGPT 给你一些建设性的反馈或建议,告诉你如何改进你拍摄或创建的图片。例如,你可以上传一张你的艺术品或设计的照片,并让 ChatGPT 对其构图、色彩、风格或信息进行评论。

故障诊断

例如,你可以上传某一设备的损坏部分的照片,以获取可能的故障原因和修复建议。

文化和旅游咨询

旅行者可以上传他们在旅途中遇到的标志、地标或文化物品的照片,以获得关于其的详细信息。

时尚和美容建议

用户可以上传他们的服装、配饰或妆容照片,以获得搭配建议或化妆技巧。

生活建议

用户可能会上传食材的照片,询问可能的食谱建议。

文本识别与翻译

你可以上传带有文字的图像,和Chatgpt就图像中的文本信息,进行对话,包括让chatgpt对图像中的文本进行翻译。

图像对话功能的意义

此功能不仅为用户提供了一种新的互动方式,还增强了AI的理解能力。通过图像,AI可以更准确地了解用户的需求,从而提供更加贴切的答案或建议。

测试体验

图像对话让Chatgpt有了一双眼睛,我们再也不用为怎么用语言向AI描述我们无法说清楚的画面而纠结,AI可以看到你的照片,并回应,这是非常酷的体验。

但是,目前使用过来,ChatGPT 在理解图像中文本——我只测试了中文,还有很大的问题。下面的几个案例,基本上就在胡说八道。

image.png

image.png

image.png

image.png

image.png

据说,在处理英文文本方面比其他语言效果要好很多。OpenAI官方也有提示,“聊天机器人‘在其他语言上表现不佳’,尤其是那些使用非罗马字母的语言。”

因此,它建议非英语用户暂时避免使用 ChatGPT 来处理图像中的文本。

未来展望

随着技术的进一步发展,我们可以预见,图像对话功能将会更加精细化,能够处理更复杂的图像内容。同时,结合其他技术如AR、VR,未来的AI交互体验将更加立体、生动。

ChatGPT的图像对话功能为我们打开了AI交互的新大门,让AI更加贴近我们的生活。无论是学习、工作还是日常生活,它都将成为我们不可或缺的智能助手。

Sort:  

Upvoted! Thank you for supporting witness @jswit.

Coin Marketplace

STEEM 0.04
TRX 0.33
JST 0.092
BTC 62610.99
ETH 1758.90
USDT 1.00
SBD 0.39