ChatGPT 视觉和 AI 艺术生成测试

2023年10月3日下午7:44 • 微软Microsoft

OpenAI最近在ChatGPT中引入了新的语音和图像功能，这是人工智能领域向前迈出的一大步。我强烈建议您查看我遇到的关于这种新的ChatGPT 4 Vision技术如何用于各种应用的第一个示例。例如，只需绘制所需程序的流程图，ChatGPT 将编写代码以使其成为现实

这些新的 ChatGPT Vision 功能使用户能够进行语音对话并向 AI 显示图像，从而扩展了 ChatGPT 在日常生活中的使用方式。从识别地标到根据食品储藏室内容建议食谱，或协助解决数学问题，可能性是巨大的，几乎是无穷无尽的。

这些语音和图像功能的推出将在未来两周内提供给ChatGPT Plus和企业用户。语音将在iOS和Android上提供，而图像将在所有平台上提供。这种功能的扩展证明了OpenAI致力于使AI更易于访问和有用。

聊天语音

ChatGPT 中的语音功能由新的文本转语音模型提供支持，该模型从文本和示例语音生成类似人类的音频。此功能是与专业配音演员合作开发的，并使用OpenAI的开源语音识别系统Whisper将口语转录为文本。与Spotify在语音翻译功能方面的合作是如何将AI集成到日常应用程序中的一个主要例子。

另一方面，图像理解由多模态 GPT-3.5 和 GPT-4 提供支持。这些模型将语言推理技能应用于各种图像，包括照片、屏幕截图以及包含文本和图像的文档。此功能允许 ChatGPT 识别图像中的特定元素，包括人和物体，甚至可以从屏幕截图中为软件即服务仪表板编写代码，如 AI 开发人员 McKay Wrigley 所示。

ChatGPT Vision

这些语音和图像技术的引入并非没有潜在的风险和挑战。新的语音技术存在潜在的风险，例如冒充或欺诈，因此其使用仅限于语音聊天等特定应用程序。基于视觉的模型也带来了挑战，例如幻觉或高风险的解释。为了降低这些风险，OpenAI在部署之前进行了广泛的测试和风险评估。

OpenAI还与盲人和低视力人群的应用程序Be My Eyes合作，以了解基于视觉的模型的用途和局限性。这种合作帮助OpenAI制定了技术措施，以限制ChatGPT分析和直接陈述人的能力，以尊重个人隐私。

尽管有这些令人印象深刻的功能，但重要的是要注意人工智能技术仍然存在局限性。例如，ChatGPT未能通过智商测试，这表明其读取自己的响应和推断反向逻辑的能力存在局限性。然而，人工智能技术的快速发展是有希望的，在软件开发和用户测试方面有潜在的应用。

OpenAI在ChatGPT中引入语音和图像功能是AI领域的重大进步。虽然这些技术存在潜在的风险和挑战，但OpenAI致力于构建安全和有益的AGI，加上严格的测试和风险评估，确保这些工具将继续得到完善和改进。随着人工智能的不断发展，它无疑将成为我们日常生活中更加不可或缺的一部分。

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun259478.html

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

通过 PowerShell 在 Windows 11 或 10 上安装 Docker Desktop

上一篇 2023年10月2日下午6:35

您现在可以通过必应聊天免费访问 DALL-E 3 型号，并 Bing.com/create

下一篇 2023年10月5日下午1:55

工具软件

OpenAI 让您无需注册即可使用 ChatGPT

OpenAI 正在消除使用 ChatGPT 的所有障碍，甚至不需要注册。该公司周一宣布，它允许用户无需注册即可开始使用聊天机器人。这里的目的是“让任何对人工智能能力感到好奇的人都能…

2024年4月6日
2024 年添加到 MS Excel 的所有新功能（到目前为止）

Microsoft定期向MS Excel添加新功能。无论是 Web、Windows、Mac 还是 iPad，这些更新对于在快速发展的科技世界中保持这一最重要的 Office 工具的…

2024年4月2日 • 工具软件
Win 11

Windows 11 将拖放功能恢复到文件资源管理器的地址栏

在 Windows 11 23H2 中删除它后，Microsoft 恢复了从文件资源管理器的地址栏本身拖放文件的功能。使用此功能，用户可以将文件从当前文件夹移动到地址栏路径中的上…

2024年4月2日
工具软件

Galaxy S25 可能会获得更快的存储空间，以实现 AI 驱动的功能

将人工智能驱动的功能集成到设备本身似乎是大多数手机制造商押注的道路。虽然它主要是为高端手机保留的，但设备仍然必须具有可以服务于AI功能的硬件功能。大多数用于人工智能的高端硬件功能都…

2024年4月2日
三星 Galaxy S22 也可能获得 AI 的好处！

众所周知，三星计划为其更高端的设备带来一系列 AI 功能，其中包括 Galaxy S23 系列、Galaxy Z Fold 5 和 Z Flip 5 以及 Galaxy Tab S…

最新资讯 2024年4月2日
苹果Apple

您可能不知道的 10 个隐藏的 iPhone 功能

您可能不知道的 10 个隐藏的 iPhone 功能在本文中，我们有一个来自 Proper Honest Tech 的精彩视频，向我们展示了您可能不知道的一系列 iPhone 功能…

2024年3月28日
Microsoft在未来几天内最终确定 Windows 11 24H2 RTM 候选者

Windows 11 24H2 可能会在几周内达到 RTM（向制造商发布）状态。这意味着Microsoft将开始向 PC 制造商提供更新，允许三星、联想或惠普等 OEM 在其即将推…

2024年3月26日 • 微软Microsoft
工具软件

如何编写 ChatGPT 提示以改善您的业务工作流程

如何编写 ChatGPT 提示以改善您的业务工作流程如果您经营一家小型企业，并且正在寻找利用人工智能（AI）来帮助您使工作流程和运营更顺畅、更高效的方法。本快速指南将为您提供…

2024年3月26日
工具软件

Copilot Pro GPT 与 ChatGPT Plus GPT 深入比较指南

Copilot Pro GPT 与 ChatGPT Plus GPT 深入比较指南如果您有兴趣了解更多关于两种主要 AI 模型提供的差异：Microsoft Copilot Pr…

2024年3月26日
工具软件

新的 OpenAI 语音引擎项目

新的 OpenAI 语音引擎项目据报道，OpenAI正在开发一个新的语音引擎项目，该项目已通过最近的“语音引擎”商标申请得到暗示。该商标表明该项目可能涉及语音和语音识别、处理命令…

2024年3月26日
苹果Apple

20 iPhone 15 和 15 Pro 相机提示和技巧

20 iPhone 15 和 15 Pro 相机提示和技巧 iPhone 15 系列再次提升了移动摄影和摄像的标准，其先进的相机功能有望将每个用户转变为熟练的内容创作者。无论你是经…

2024年3月26日
工具软件

Creatie：主打AI功能的UI设计软件

Creatie：主打AI功能的UI设计软件我去 Creatie 这个 AI UI 设计工具有点强啊，做的相当完整，基本上可以当做一个加上了 AI 功能的 FIgma。而且全部都…

2024年3月26日
工具软件

发布新的 ChatGPT 更新，以改善响应、协作和可用性

发布新的 ChatGPT 更新，以改善响应、协作和可用性 OpenAI 发布了 ChatGPT 的新更新，引入了多项旨在改善协作、创造力和整体用户体验的功能。2024 年 3 月的…

2024年3月24日
工具软件

如何掌握 ChatGPT：提示、技巧和最佳实践

如何掌握 ChatGPT：提示、技巧和最佳实践在瞬息万变且超级令人兴奋的人工智能世界中，ChatGPT 已成为真正的游戏规则改变者。想象一下，有一个伙伴，他不仅擅长写出听起来像人…

2024年3月24日
工具软件

MacBook的基本技巧和窍门

MacBook的基本技巧和窍门对于希望提高工作效率和个性化数字工作空间的 MacBook 用户来说，这里有大量功能等待您去发现。本指南将引导您了解几个不可或缺的提示和技巧，这些技…

2024年3月24日
工具软件

发现惊人的三星 Galaxy S24、S24+ 提示和技巧

三星 Galaxy S24、S24+ 提示和技巧随着技术的不断发展，三星走在最前沿，推出了 Galaxy S24 系列。这个现代工程的奇迹不仅拥有显着的硬件改进，而且还通过其软件…

2024年3月21日
工具软件

如何使用 ChatGPT 创建概念模板

如何使用 ChatGPT 创建概念模板在当今快节奏的数字环境中，生产力和创造力工具已成为不可或缺的，尤其是对于那些管理健身教练等个人业务的人来说。Notion 凭借其灵活的平台，…

2024年3月21日
适用于低端 PC 的 6 款最佳代码编辑器

无论您是寻找轻量级代码编辑器的初学者，还是寻求优化性能的专业人士，您都需要找到合适的代码编辑器。在本指南中，我们将讨论适用于低端 PC 的最佳代码编辑器，以帮助您在资源效率和功能…

2024年3月20日 • 工具软件
苹果Apple

苹果的 iOS 18 新功能泄露

苹果的 iOS 18 新功能泄露在日益增长的期待和兴奋中，技术爱好者和苹果爱好者正坐在座位的边缘，热切地等待着iOS 18的发布。据传，这个备受期待的版本将在 WWDC 2024…

2024年3月17日
工具软件

15+ 在日常生活中使用 ChatGPT 的实用而强大的方法

15+ 在日常生活中使用 ChatGPT 的实用而强大的方法 ChatGPT 和 GPT-4 等其他大型语言模型已迅速发展成为功能强大的 AI 助手。这些人工智能工具不仅仅是聊天机…

2024年3月17日
工具软件

使用 Midjourney Character Reference 为书籍和漫画创建一致的角色

使用 Midjourney Character Reference 为书籍和漫画创建一致的角色如果您有兴趣学习如何以角色引用的形式使用在 Midjourney 6 中推出的最新功…

2024年3月15日
苹果Apple

你需要知道的12个Apple Watch提示和技巧

你需要知道的12个Apple Watch提示和技巧释放 Apple Watch 的全部潜力，可以将其从单纯的时计转变为生产力和个人护理的动力源泉。 Proper Honest T…

2024年3月15日
工具软件

OpenAI 首席技术官透露可能的 Sora AI 视频生成器发布日期

OpenAI 首席技术官透露可能的 Sora AI 视频生成器发布日期 OpenAI 首席技术官（CTO） Mira Murati 在接受《华尔街日报》采访时，对 OpenAI …

2024年3月15日
如何让 ChatGPT 大声朗读它的答案

与 ChatGPT 交谈轻而易举，但在旅途中或多任务处理时可能会很棘手。值得庆幸的是，多亏了新的“大声朗读”功能，你可以让 ChatGPT 用几种不同的语言大声说出答案，甚至可以设…

2024年3月6日 • 工具软件
工具软件

ChatGPT 正在推出“记忆”功能，让您的回复更加个性化

OpenAI 宣布将在 ChatGPT 中推出一项“记忆”功能，旨在记住您对话中的特定内容。这样，您可以从上次中断的地方继续，因为 ChatGPT 现在将能够根据您的偏好和需求回复…

2024年2月23日

ChatGPT 视觉和 AI 艺术生成测试

聊天语音

ChatGPT Vision

相关推荐