chatgpt图像识别能力 OpenAI正式发布GPT-4:ChatGPT Plus订阅用户可使用其文本功能

AI资讯8个月前发布 fengdao
12 0

人工智能公司当地时间周二推出了其大型语言模型的最新版本GPT-4,这是一个分析图像和模仿人类语言的先进工具,推动了迅速扩散的人工智能浪潮的技术和道德界限。

相比之下,GPT-4是一个最先进的系统,它不仅能够创造出文字,而且能够根据人的简单书面命令描述图像。例如,当看到一张悬挂在木制跷跷板上的拳击手套的照片时,一个人可以问如果手套掉下来会发生什么,GPT-4会回答说它会撞击跷跷板并导致球飞起来。

GPT-4被称为大型语言模型,早期测试人员声称其推理和学习新事物的能力非常先进。事实上,公众对这一工具有一个初步的预览。微软周二宣布,上个月发布的必应人工智能聊天机器人一直都在使用GPT-4。

图象识别检测_图像识别功能_chatgpt图像识别能力

开发人员在周二的一篇博文中承诺,该技术可以进一步革新工作和生活。但这些承诺也加剧了人们的焦虑,他们担心人们将如何竞争被外包给机器的工作,或相信他们在网上看到的东西的准确性。

据介绍,GPT-4在文本和图像方面的「多模态」训练将使它能够摆脱聊天框,更充分地模拟一个拥有色彩和图像的世界,在其 「高级推理能力」方面超过。一个人可以上传一张图片,而GPT-4可以为其添加标题,描述物体和场景。

图象识别检测_chatgpt图像识别能力_图像识别功能

但由于担心被滥用,该公司推迟了其图像描述功能的发布,而的订阅服务 Plus的成员可以率先使用的GPT-4版本提供文本功能。

政策研究员 在周二的简报中告诉媒体,该公司推迟这一功能是为了更好地了解潜在风险。她举了一个例子,该模型可能能够查看一大群人的图像,并提供关于他们的已知信息,包括他们的身份–这是一个可能的面部识别用例,可能被用于大规模监控。(发言人Niko Felix说,该公司计划 「实施保障措施,防止识别私人个体」。)

在其博客文章中说,GPT- 4 仍然犯了许多以前版本的错误,包括「一本正经的胡说八道」,延续社会偏见和提供不好的建议。它还缺乏对 2021 年 9 月左右发生的事件的了解,当时它的训练数据已经定稿,这限制了人们教它新东西的能力。

© 版权声明

相关文章

暂无评论

暂无评论...