Visual ChatGPT:GPT-4 推出前的临时解决方案

ChatGPT 不久前推出,开启了生成人工智能行业的新纪元。随着聊天机器人的成名和成功,更多的人工智能工具应运而生。微软已采取重要步骤来改进生成式 AI 工具,尤其是在过去几年中。不幸的是,  ChatGPT是一种基于文本的语言模型,它不具备与 DALL-E 2 或Wombo Dream相同的能力。但是,随着 Visual ChatGPT 的推出,它发生了变化。

什么是 Visual ChatGPT?

ChatGPT 是一个纯文本聊天机器人,不具备生成图像或视频的能力,预计 GPT-4 会改变这一点。 但是,Visual ChatGPT 可帮助您生成、修改或裁剪图像。它结合了ChatGPT和其他 VFM的功能,例如Stable Diffusion,连接 ChatGPT 和一系列 Visual Foundation Models 以在聊天期间发送和接收图像。

换句话说,Visual ChatGPT 帮助用户从文本提示中生成图像。它缺少 Stable Diffusion 等其他 AI 工具所具有的功能,而现在,在某种程度上,它是完整的。

“我们没有从头开始训练新的多模式 ChatGPT,而是直接基于ChatGPT构建 Visual ChatGPT ,并结合了各种 VFM,”微软表示。

microsoft-visual-chatgpt-scaled-1
信用:微软

GPU内存使用情况?

研究人员还在官方 GitHub 页面上提供了 GPU 内存使用统计数据。它需要很高的 GPU 和计算能力。您将在下面找到每个视觉基础模型的 GPU 内存使用情况:

基础模型 内存使用 (MB)
图片编辑 6667
图片说明 1755
T2I 6677
canny2image 5540
line2image 6679
hed2image 6679
scribble2image 6679
姿态图像 6681
BLIPVQA 2709
seg2image 5540
深度2图像 6677
正常2图像 3974
指导像素2像素 2795

能力

如前所述,ChatGPT 经过培训可以为用户提供基于文本的答案,但缺乏图像或视频创建。Visual ChatGPT 的能力如下:

  • 发送和接收的不仅是语言,还有图像。
  • 提供复杂的视觉问题或视觉编辑指令,需要多个 AI 模型多步骤协作。
  • 提供反馈并要求更正结果。

GPT-4 发布日期

上周,微软德国 CTO 宣布 GPT-4 将在“下周”发布。他在 3 月 9 日发表声明,这意味着新型号可能会在未来几天推出。如果不启动,OpenAI 至少会向社区介绍它。

GPT-4 将是一个多模式 LLM,能够在 GPT-3.5 的文本提示功能之上从文本提示创建图像和视频。关于Visual ChatGPT的更多信息,可以查看 官方Github页面

原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun219581.html

(0)
打赏 微信扫一扫不于多少! 微信扫一扫不于多少! 支付宝扫一扫礼轻情意重 支付宝扫一扫礼轻情意重
上一篇 2023年3月14日 上午8:21
下一篇 2023年3月14日 上午8:24

虚拟币主流交易所最新域名,持续更新新地址

相关推荐

  • 教授能检测到谷歌吟游诗人和ChatGPT吗?

    教授能检测学生是否使用Google Bard或ChatGPT来写论文吗? 这是全球学生心中的问题。鉴于学生可以轻松访问和使用Bard和ChatGPT来撰写论文,教授的任务确实变得更加困难 学习如何击败以这些人工智能聊天机器人的速度...

    2023年3月31日
  • 如何使用蓝柳在 Discord 上创建 AI 艺术的文本

    什么是蓝柳AI,它是如何工作的 BlueWillow 可以根据用户的输入轻松生成精美的艺术品、图形和徽标。BlueWillow使用多种AI图像生成模型,包括稳定扩散和Dall-E。前 25 次运行可以免费使用,但之后您必须付费。个人可以...

    2023年3月31日 技术教程
  • 5 大 AI 艺术生成器:DALL-E 2 及更多 (2023)

    5 大 AI 艺术生成器:它们的用途是什么? AI 艺术生成器是使用人工智能算法创建图像或艺术品的计算机程序。它们旨在模仿人类艺术家的创作过程,并允许用户在没有艺术技能或经验的情况下创作出独特的艺术作品。您可以...

    2023年3月31日 工具软件
  • 人工智能艺术生成器 Midjourney 因“滥用”其图像而结束其免费试用

    甚至在 ChatGPT、Bard和Bing Chat等聊天机器人推出之前,人工智能就已经被越来越多的人用来根据一些文本提示来创作艺术和图像。本周,该领域最知名的公司之一Midjourney宣布突然终止其免费试用,其原因可能会对其他...

    最新资讯 2023年3月31日
  • 微软宣布推出 Security Copilot,利用 GPT-4 开启“安全新时代”

    微软宣布了将 OpenAI 的 GPT-4 集成到其服务和软件中的最新方式。微软相信,通过一款名为 Security Copilot 的全新应用程序,利用 GPT-4 的 AI 将通过帮助信息安全专业人员节省时间、简化复杂情况、发现其他人遗漏的...

    微软Microsoft 2023年3月29日
  • 苹果收购人工智能公司WaveOne

    Apple 收购了一家人工智能领域的公司。报导指出,Apple 「低调地」收购了位于Mountain View 的公司WaveOne,该初创公司正在「开发用于压缩视频的AI 算法」。 Apple 并未确认此次收购,但WaveOne 高管Bob Stankosh 在...

    2023年3月28日
  • 微软正在将 AI 生成的内容添加到 Bing 的搜索结果中

    Microsoft 继续发展 Bing Chat 和 AI 支持的服务。上周,微软推出了必应更新,将人工智能生成的内容引入搜索结果。 到目前为止,AI 聊天伴侣 Bing Chat 与传统网络搜索引擎 Bing Search 是分开的。用户必须选择 Bing...

    2023年3月27日
  • 微软重拳打击人工智能聊天机器人竞争对手

    AI 聊天机器人的世界似乎出现了愈演愈烈的冲突。根据最近的报道,微软正在考虑阻止其他公司使用其搜索引擎 Bing 中的数据。此举是在指控几家公司正在使用这些数据来增强他们自己的聊天机器人的情况下进行的。 据彭博...

    2023年3月27日
  • 如何在 Opera 中使用 ChatSonic AI

    在人工智能驱动的浏览器之战中,Opera 似乎是凭空冒出来的。在最近的公告中,Opera 在其侧边栏中展示了 ChatGPT 和 ChatSonic 的集成,以及在地址栏中称为 AI 提示的 AI 功能。对于那些不知道 ChatSonic(ChatGPT 的...

    2023年3月26日 工具软件
  • IFTTT 宣布加入3 项AI 功能

    IFTTT宣布为ITTT Pro+ 用户提供3 项新的AI 功能,分别为AI Social Creator、AI Content Creator 及AI Summarizer。 AI Social Creator 可以为用户的网志内容产生Facebook、Tweet、LinkedIn 等社交媒体更新,当中可自...

    2023年3月26日
  • Mozilla 宣布 Mozilla.ai 为“可信赖的人工智能”

    Mozilla 今天宣布,他们将投资 3000 万美元将 Mozilla.ai 打造为一家专注于“构建值得信赖、独立和开源的 AI 生态系统”的新初创企业。 Mozilla.ai 是 Mozilla 另一个有问题的非浏览器(非核心业务)想法,当时他们面...

    2023年3月23日
  • Adobe 押注生成式人工智能,使用“萤火虫”工具从文本创建图像

    有如此多的应用程序将 AI 集成到他们的系统中,Adobe 也这样做才有意义。Adobe 最近通过收购生成式 AI 加入了这场游戏,这是一种名为 Firefly 的新 AI 模型。 主要重点是将AI 引入 Adob​​e 的应用程序和服务套件。Ad...

    2023年3月23日
  • 为什么我们仍然无法访问 Microsoft 365 Copilot?

    如果你用谷歌搜索“Microsoft 365 Copilot 发布日期”,它会显示 3 月 16 日。即使微软在那个确切的日期在“人工智能工作的未来”活动中宣布了它,但大多数用户仍然无法访问它,因为它还没有尚未“真正推出”。 微软在 3 ...

    2023年3月23日
  • Notion AI:革命性的生产力工具

    总部位于旧金山的生产力初创公司Notion设定了一个新目标,即利用其最新的尖端人工智能技术扩大其用户群。Notion AI 于 2 月 22 日发布,是一项强大的生成式 AI 功能,旨在帮助用户完成诸如总结笔记、识别会议中的行...

    2023年3月23日
  • Opera 浏览器正式加入ChatGPT 功能

    Opera 浏览器和Opera GX发布了一系列AI 功能,这些功能包括AI Prompts、ChatGPT 和ChatSonic,都是基于人工智能生成内容(AIGC)的技术,可以帮助用户理解、整理和探索网络上的各种内容。 AI Prompts 是一个可以根据...

    2023年3月23日
  • 谷歌的 Bard:赶超 OpenAI 的对话式 AI 服务

    Alphabet Inc. 的子公司Google宣布推出名为 Bard 的对话式 AI 服务,与 OpenAI Inc. 的 ChatGPT 展开竞争。该公司已经为美国和英国的用户开设了候补名单,并会陆续增加。Bard的推出是谷歌在人工智能领域追赶OpenAI I...

    2023年3月22日
  • Opera 浏览器更新集成了 AI Prompts 和 ChatGPT

    Opera Software 今天发布了公司 Opera 网络浏览器的新版本。新版本的一个重点是在 Opera 浏览器中引入了新的人工智能功能。 该功能由 OpenAI 提供支持,OpenAI 也支持微软的 Bing Chat 工具和该公司 Edge 网络浏览器...

    2023年3月22日
  • 微软在 Azure OpenAI 服务中添加 GPT-4,供企业制作自己的 AI 应用

    微软在过去的几天里,它的人工智能相关公告一直在流泪,而且它并没有停止。今天,在其 Bing Chat 服务中展示了新的Bing Image Creator之后,该公司刚刚宣布将 GPT-4 添加到其 Azure OpenAI 服务中。 这项新服务旨在...

    2023年3月22日
  • Microsoft Azure 将托管两个新的 NVIDIA 云服务;一种用于人工智能,一种用于元宇宙

    作为今天在 GTC 开发者和人工智能大会上发布的众多公告的一部分,NVIDIA 透露了与微软的新合作伙伴关系。此次合作将推出两款新的NVIDIA由Microsoft托管的基于云的服务天蓝色。 第一个是英伟达Omniverse Cloud,专为...

    最新资讯 2023年3月22日
  • 微软人工智能 Bing 体验获得图像创建功能

    微软今天宣布,其人工智能增强型 Bing 浏览器现在包括Bing Image Creator,这是一种由 OpenAI 的 DALL-E 深度学习模型提供支持的图像生成技术。 DALL-E旨在通过自然语言描述生成数字内容,它已经成为流行的图像生成...

    2023年3月22日
  • Google 聊天机器人Bard 来了!快申请测试吧!

    Google 正式宣布将自家AI 聊天机器人Bard 开放进行测试。Google 指出Bard 将仅生成英文答案,而不是电脑代码或其他语言,并将按先到先服务的方式向美国和英国等候名单上的用户提供访问许可权。Google 指,希望先获得...

    2023年3月22日
  • 微软Bing Image Creator 发布, 用文字生成图片

    微软宣布正式推出Bing Image Creator,这是New Bing 整合ChatGPT 技术后,另一大生成式AI 焦点。用户只要输入文字,AI 会按你的意思绘出图画。 Bing Image Creator 的核心技术来自于OpenAI 的最新DALL∙E 模型,用户...

    2023年3月22日
  • 谷歌开始开放对其 ChatGPT 竞争对手 Bard 的访问

    从美国和英国开始,消费者可以加入英语访问 Bard 的候补名单,该计划以前只对获得批准的测试人员开放。谷歌将巴德描述为一项实验,允许与生成人工智能合作,该技术依赖过去的数据来创建而不是识别内容。 微软支持的...

    谷歌Google 2023年3月22日
  • 谷歌推出其 Bard Chatbot 以对抗 ChatGPT

    未使用谷歌在人工智能或 搜索领域迎头赶上 ,但今天这家公司正在努力表明它并没有失去优势。它开始推出 名为 Bard 的聊天机器人,以与轰动一时的 ChatGPT进行较量。  Bard 和 ChatGPT 一样,将以有时看起来像人类的...

    谷歌Google 2023年3月22日
  • 谷歌发布 Bard,它在创建 AI 聊天机器人竞赛中的竞争对手

    在三个多月的时间里,谷歌高管一直在关注微软和一家名为 OpenAI 的旧金山初创公司的项目,它们用人工智能的潜力激发了公众的想象力。 但在周二,谷歌暂时退出了场外,发布了一款名为 Bard 的聊天机器人。谷歌高管在...

    2023年3月22日