认识开发开源 ChatGPT 替代方案的团队

“Together 正在为开放式基础模型构建一个可访问的平台,”Together 的联合创始人 Vipul Ved Prakash 在接受电子邮件采访时告诉 TechCrunch。“我们认为我们正在构建的东西是 AI 的‘Linux 时刻’的一部分。” 我们希望让研究人员、开发人员和公司能够通过一个将数据、模型和计算结合在一起的平台来使用和改进开源人工智能模型。”

Prakash 之前与人共同创立了Cloudmark,这是一家网络安全初创公司,Proofpoint 在 2017 年以 1.1 亿美元的价格收购了它。在 2013 年 Apple 收购了 Prakash 的下一家企业社交媒体搜索和分析平台Topsy之后,他在 Apple 担任了五年的高级主管,之后一起离开开始。

上周末,Together 推出了它的第一个主要项目OpenChatKit,这是一个用于创建专用和通用 AI 聊天机器人的框架。该套件可在 GitHub 上获得,包括上述经过训练的模型和一个“可扩展”检索系统,该系统允许模型从各种来源和网站提取信息(例如最新的体育比分)。

基本模型来自 EleutherAI,这是一个研究文本生成系统的非营利性研究小组。但他们使用 Together 的计算基础设施 Together Decentralized Cloud 进行了微调,该基础设施汇集了硬件资源,包括来自互联网志愿者的 GPU。

“共同开发了源存储库,允许任何人复制模型结果、微调他们自己的模型或集成检索系统,”Prakash 说。“还共同开发了文档和社区流程。”

除了训练基础设施之外,Together 还与其他研究组织合作,包括 LAION(帮助开发了Stable Diffusion)和技术专家 Huu Nguyen 的Ontocord,为模型创建了训练数据集。称为Open Instruction Generalist Dataset,该数据集包含超过 4000 万个问题和答案示例、后续问题以及更多旨在“教”模型如何响应不同指令(例如“为历史论文写大纲内战”)。

为了征求反馈,Together 发布了一个演示,任何人都可以使用该演示与 OpenChatKit 模型进行交互。

“主要动机是让任何人都可以使用 OpenChatKit 来改进模型以及创建更多特定于任务的聊天模型,”Prakash 补充道。“虽然大型语言模型在回答一般问题方面表现出令人印象深刻的能力,但在针对特定应用程序进行微调时,它们往往会达到更高的准确性。”

Prakash 表示,这些模型可以执行一系列任务,包括解决基本的高中数学问题、生成 Python 代码、撰写故事和总结文档。那么他们经得起考验的情况如何?好吧,根据我的经验——至少在基本的事情上,比如写听起来似是而非的求职信。

但是有一个非常明确的限制。继续与 OpenChatKit 模型聊天足够长的时间,它们就会开始遇到与 ChatGPT 和其他最近的聊天机器人一样的问题,比如鹦鹉学舌地提供虚假信息。例如,我让 OpenChatKit 模型给出了关于地球是否平坦的矛盾答案,以及关于谁赢得 2020 年美国总统大选的完全错误的陈述。

OpenChatKit 模型在其他不太令人担忧的领域较弱,例如上下文切换。在谈话中改变话题通常会使他们感到困惑。他们也不是特别擅长创意写作和编码任务,有时会无休止地重复他们的回答。

Prakash 将此归咎于训练数据集,他指出这是一项正在进行的积极工作。“这是一个我们将继续改进的领域,我们已经设计了一个开放社区可以积极参与其中的流程,”他说,指的是演示。

OpenChatKit 回答的质量可能有待改进。(公平地说,根据提示,ChatGPT 并没有明显好转。)但是 Together正在积极主动——或者至少试图主动——在审核方面。

虽然一些类似于 ChatGPT聊天机器人可能会被提示写有偏见或仇恨的文本,但由于它们的训练数据(其中一些来自有毒来源),OpenChatKit 模型更难强制。我 的设法让他们写了一封网络钓鱼电子邮件,但他们不会被引诱到更有争议的领域,比如支持大屠杀或证明为什么男性比女性更适合做 CEO。

不过,审核是 OpenChatKit 的一个可选功能——开发人员不需要使用它。根据 Prakash 的说法,虽然其中一个模型是为另一个更大的模型(为演示提供动力的模型)“专门设计为护栏”,但更大的模型默认情况下没有应用过滤。

这与 OpenAI、Anthropic 和其他公司青睐的自上而下方法不同,后者涉及在 API 级别结合人工和自动调节和过滤。Prakash 认为,从长远来看,这种幕后的不透明性可能比 OpenChatKit 缺乏强制性过滤器更有害。

“与许多两用技术一样,人工智能当然可以用于恶意环境。这对于开放式人工智能或通过 API 商业化的封闭系统来说是正确的,”Prakash 说。“我们的论点是,开放研究社区对生成人工智能技术的审计、检查和改进越多,我们作为一个社会就能更好地为这些风险提出解决方案。我们认为,如果大型人工智能生成模型的力量完全掌握在少数大型科技公司手中,无法进行审计、检查或理解,那么风险会更大。”

强调 Prakash 关于开放式开发的观点,OpenChatKit 包括第二个训练数据集,称为 OIG-moderation,旨在解决一系列聊天机器人调节挑战,包括机器人采用过于激进或压抑的语气。(参见:Bing Chat。)它被用来训练 OpenChatKit 中两个模型中较小的一个,Prakash 说 OIG-moderation 可以应用于创建其他模型,如果开发人员选择这样做,可以检测并过滤掉有问题的文本。

“我们非常关心 AI 安全,但我们认为从长远来看,通过默默无闻来确保安全是一种糟糕的方法。开放、透明的姿态被广泛接受为计算机安全和密码学领域的默认姿态,我们认为如果我们要构建安全的 AI,透明度将是至关重要的,”Prakash 说。“维基百科很好地证明了开放社区如何成为应对大规模挑战性审核任务的绝佳解决方案。”

我不确定。对于初学者来说,维基百科并不完全是黄金标准——该网站的审核过程以不透明和地域性着称。然后,开源系统经常被滥用(而且很快)。以生成图像的 AI 系统 Stable Diffusion 为例,在其发布后的几天内,4chan 等社区就在使用该模型——其中还包括可选的审核工具——来制作非自愿的著名演员色情深度造假。

OpenChatKit 的许可证明确禁止诸如生成错误信息、宣扬仇恨言论、发送垃圾邮件以及参与网络欺凌或骚扰等用途。但是没有什么可以阻止恶意行为者忽略这些条款和审核工具。

预料到最坏的情况,一些研究人员已经开始对开放式聊天机器人发出警告。

NewsGuard 是一家追踪在线错误信息的公司,在最近的一项研究中发现,较新的聊天机器人,特别是 ChatGPT,可能会被提示编写内容来宣传有关疫苗的有害健康声明,模仿来自中国和俄罗斯的宣传和虚假信息,并呼应党派新闻媒体的基调. 根据这项研究,当被要求根据错误和误导性的想法撰写回复时,ChatGPT 在大约 80% 的情况下都能做到。

作为对 NewsGuard 调查结果的回应,OpenAI 在后端改进了 ChatGPT 的内容过滤器。当然,这对于像 OpenChatKit 这样的系统来说是不可能的,它把保持模型更新的责任放在了开发人员身上。

原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun219824.html

(0)
打赏 微信扫一扫不于多少! 微信扫一扫不于多少! 支付宝扫一扫礼轻情意重 支付宝扫一扫礼轻情意重
上一篇 2023年3月14日 下午8:55
下一篇 2023年3月14日 下午11:29

虚拟币主流交易所最新域名,持续更新新地址

相关推荐

  • 教授能检测到谷歌吟游诗人和ChatGPT吗?

    教授能检测学生是否使用Google Bard或ChatGPT来写论文吗? 这是全球学生心中的问题。鉴于学生可以轻松访问和使用Bard和ChatGPT来撰写论文,教授的任务确实变得更加困难 学习如何击败以这些人工智能聊天机器人的速度...

    2023年3月31日
  • 如何使用蓝柳在 Discord 上创建 AI 艺术的文本

    什么是蓝柳AI,它是如何工作的 BlueWillow 可以根据用户的输入轻松生成精美的艺术品、图形和徽标。BlueWillow使用多种AI图像生成模型,包括稳定扩散和Dall-E。前 25 次运行可以免费使用,但之后您必须付费。个人可以...

    2023年3月31日 技术教程
  • 5 大 AI 艺术生成器:DALL-E 2 及更多 (2023)

    5 大 AI 艺术生成器:它们的用途是什么? AI 艺术生成器是使用人工智能算法创建图像或艺术品的计算机程序。它们旨在模仿人类艺术家的创作过程,并允许用户在没有艺术技能或经验的情况下创作出独特的艺术作品。您可以...

    2023年3月31日 工具软件
  • 人工智能艺术生成器 Midjourney 因“滥用”其图像而结束其免费试用

    甚至在 ChatGPT、Bard和Bing Chat等聊天机器人推出之前,人工智能就已经被越来越多的人用来根据一些文本提示来创作艺术和图像。本周,该领域最知名的公司之一Midjourney宣布突然终止其免费试用,其原因可能会对其他...

    最新资讯 2023年3月31日
  • 聊天GPT与吟游诗人:5个主要区别

    在聊天机器人之战中,最终用户是最终的赢家。因此,与其选边站,不如让我们谈谈OpenAI的ChatGPT和谷歌的Bard之间的主要区别。从它们的底层神经架构到它们的特征,本文将探讨两者之间的细节,是什么让它们与众不同,...

    2023年3月30日 谷歌Google
  • 微软宣布推出 Security Copilot,利用 GPT-4 开启“安全新时代”

    微软宣布了将 OpenAI 的 GPT-4 集成到其服务和软件中的最新方式。微软相信,通过一款名为 Security Copilot 的全新应用程序,利用 GPT-4 的 AI 将通过帮助信息安全专业人员节省时间、简化复杂情况、发现其他人遗漏的...

    微软Microsoft 2023年3月29日
  • 苹果收购人工智能公司WaveOne

    Apple 收购了一家人工智能领域的公司。报导指出,Apple 「低调地」收购了位于Mountain View 的公司WaveOne,该初创公司正在「开发用于压缩视频的AI 算法」。 Apple 并未确认此次收购,但WaveOne 高管Bob Stankosh 在...

    2023年3月28日
  • 微软正在将 AI 生成的内容添加到 Bing 的搜索结果中

    Microsoft 继续发展 Bing Chat 和 AI 支持的服务。上周,微软推出了必应更新,将人工智能生成的内容引入搜索结果。 到目前为止,AI 聊天伴侣 Bing Chat 与传统网络搜索引擎 Bing Search 是分开的。用户必须选择 Bing...

    2023年3月27日
  • 微软重拳打击人工智能聊天机器人竞争对手

    AI 聊天机器人的世界似乎出现了愈演愈烈的冲突。根据最近的报道,微软正在考虑阻止其他公司使用其搜索引擎 Bing 中的数据。此举是在指控几家公司正在使用这些数据来增强他们自己的聊天机器人的情况下进行的。 据彭博...

    2023年3月27日
  • ChatGPT 替代方案内置超级大货 - ChatSonic(现在支持 GPT-4)

    像 Chat GPT 这样的革命性 AI - ChatSonic(现在具有 GPT-4 功能),对话式 AI 聊天机器人解决了 ChatGPT 的局限性,结果证明它是最好的 Chat GPT 替代品。 无需信用卡。 开始聊天! 受到 1,000,000 多个营销团队、...

    2023年3月27日 工具软件
  • 如何在 Opera 中使用 ChatSonic AI

    在人工智能驱动的浏览器之战中,Opera 似乎是凭空冒出来的。在最近的公告中,Opera 在其侧边栏中展示了 ChatGPT 和 ChatSonic 的集成,以及在地址栏中称为 AI 提示的 AI 功能。对于那些不知道 ChatSonic(ChatGPT 的...

    2023年3月26日 工具软件
  • 微软不希望其他 AI 聊天机器人使用其 Bing 搜索数据

    甚至像微软继续改进自己的Bing Chat 聊天机器人,据报道,它正试图阻止可能的竞争对手使用该公司的搜索数据。这是根据彭博社(通过The Verge)的一份新报告得出的,该报告通过未具名的消息来源声称,微软已向两个从 ...

    2023年3月26日
  • ChatGPT 推出插件助上网取得新资料

    ChatGPT 只能从截至2021 年的培训数据中提取信息,想知道今年奥斯卡获奖者是无法实现。不过,OpenAI 宣布逐步为ChatGPT 推出插件,显著扩展了该聊天机器人的功能。第一批插件现已在alpha 版本中向部分ChatGPT 用户和...

    2023年3月26日
  • IFTTT 宣布加入3 项AI 功能

    IFTTT宣布为ITTT Pro+ 用户提供3 项新的AI 功能,分别为AI Social Creator、AI Content Creator 及AI Summarizer。 AI Social Creator 可以为用户的网志内容产生Facebook、Tweet、LinkedIn 等社交媒体更新,当中可自...

    2023年3月26日
  • Mozilla 宣布 Mozilla.ai 为“可信赖的人工智能”

    Mozilla 今天宣布,他们将投资 3000 万美元将 Mozilla.ai 打造为一家专注于“构建值得信赖、独立和开源的 AI 生态系统”的新初创企业。 Mozilla.ai 是 Mozilla 另一个有问题的非浏览器(非核心业务)想法,当时他们面...

    2023年3月23日
  • Adobe 押注生成式人工智能,使用“萤火虫”工具从文本创建图像

    有如此多的应用程序将 AI 集成到他们的系统中,Adobe 也这样做才有意义。Adobe 最近通过收购生成式 AI 加入了这场游戏,这是一种名为 Firefly 的新 AI 模型。 主要重点是将AI 引入 Adob​​e 的应用程序和服务套件。Ad...

    2023年3月23日
  • 为什么我们仍然无法访问 Microsoft 365 Copilot?

    如果你用谷歌搜索“Microsoft 365 Copilot 发布日期”,它会显示 3 月 16 日。即使微软在那个确切的日期在“人工智能工作的未来”活动中宣布了它,但大多数用户仍然无法访问它,因为它还没有尚未“真正推出”。 微软在 3 ...

    2023年3月23日
  • Notion AI:革命性的生产力工具

    总部位于旧金山的生产力初创公司Notion设定了一个新目标,即利用其最新的尖端人工智能技术扩大其用户群。Notion AI 于 2 月 22 日发布,是一项强大的生成式 AI 功能,旨在帮助用户完成诸如总结笔记、识别会议中的行...

    2023年3月23日
  • 如何删除 ChatGPT 限制并获取受限答案

    ChatGPT 有哪些限制? 开发 ChatGPT 的公司 OpenAI 非常清楚这样一个事实,即他们的 AI 聊天机器人,就像在人类生成的数据集上训练的任何其他 AI 程序一样,必然会有偏见和成见。而且因为它想要聊天由于 ChatGPT 是...

    2023年3月23日 最新资讯
  • Opera 浏览器正式加入ChatGPT 功能

    Opera 浏览器和Opera GX发布了一系列AI 功能,这些功能包括AI Prompts、ChatGPT 和ChatSonic,都是基于人工智能生成内容(AIGC)的技术,可以帮助用户理解、整理和探索网络上的各种内容。 AI Prompts 是一个可以根据...

    2023年3月23日
  • 谷歌的 Bard:赶超 OpenAI 的对话式 AI 服务

    Alphabet Inc. 的子公司Google宣布推出名为 Bard 的对话式 AI 服务,与 OpenAI Inc. 的 ChatGPT 展开竞争。该公司已经为美国和英国的用户开设了候补名单,并会陆续增加。Bard的推出是谷歌在人工智能领域追赶OpenAI I...

    2023年3月22日
  • Opera 浏览器更新集成了 AI Prompts 和 ChatGPT

    Opera Software 今天发布了公司 Opera 网络浏览器的新版本。新版本的一个重点是在 Opera 浏览器中引入了新的人工智能功能。 该功能由 OpenAI 提供支持,OpenAI 也支持微软的 Bing Chat 工具和该公司 Edge 网络浏览器...

    2023年3月22日
  • 微软在 Azure OpenAI 服务中添加 GPT-4,供企业制作自己的 AI 应用

    微软在过去的几天里,它的人工智能相关公告一直在流泪,而且它并没有停止。今天,在其 Bing Chat 服务中展示了新的Bing Image Creator之后,该公司刚刚宣布将 GPT-4 添加到其 Azure OpenAI 服务中。 这项新服务旨在...

    2023年3月22日
  • Microsoft Azure 将托管两个新的 NVIDIA 云服务;一种用于人工智能,一种用于元宇宙

    作为今天在 GTC 开发者和人工智能大会上发布的众多公告的一部分,NVIDIA 透露了与微软的新合作伙伴关系。此次合作将推出两款新的NVIDIA由Microsoft托管的基于云的服务天蓝色。 第一个是英伟达Omniverse Cloud,专为...

    最新资讯 2023年3月22日
  • 谷歌开放访问 Bard AI 聊天机器人

    谷歌今天开始允许用户注册使用 Bard,这是其人工智能驱动的聊天机器人,可与微软的 Bing 聊天机器人相媲美。Bard 于 2 月首次发布,是一项针对 Google 搜索的实验性对话式 AI 服务。 对 Bard 感兴趣的人可以加入 Goo...

    2023年3月22日