认识开发开源 ChatGPT 替代方案的团队

2023年3月14日下午11:18 • 工具软件

点击进入：ChatGPT工具插件导航大全

“Together 正在为开放式基础模型构建一个可访问的平台，”Together 的联合创始人 Vipul Ved Prakash 在接受电子邮件采访时告诉 TechCrunch。“我们认为我们正在构建的东西是 AI 的‘Linux 时刻’的一部分。” 我们希望让研究人员、开发人员和公司能够通过一个将数据、模型和计算结合在一起的平台来使用和改进开源人工智能模型。”

Prakash 之前与人共同创立了Cloudmark，这是一家网络安全初创公司，Proofpoint 在 2017 年以 1.1 亿美元的价格收购了它。在 2013 年 Apple 收购了 Prakash 的下一家企业社交媒体搜索和分析平台Topsy之后，他在 Apple 担任了五年的高级主管，之后一起离开开始。

上周末，Together 推出了它的第一个主要项目OpenChatKit，这是一个用于创建专用和通用 AI 聊天机器人的框架。该套件可在 GitHub 上获得，包括上述经过训练的模型和一个“可扩展”检索系统，该系统允许模型从各种来源和网站提取信息（例如最新的体育比分）。

基本模型来自 EleutherAI，这是一个研究文本生成系统的非营利性研究小组。但他们使用 Together 的计算基础设施 Together Decentralized Cloud 进行了微调，该基础设施汇集了硬件资源，包括来自互联网志愿者的 GPU。

“共同开发了源存储库，允许任何人复制模型结果、微调他们自己的模型或集成检索系统，”Prakash 说。“还共同开发了文档和社区流程。”

除了训练基础设施之外，Together 还与其他研究组织合作，包括 LAION（帮助开发了Stable Diffusion）和技术专家 Huu Nguyen 的Ontocord，为模型创建了训练数据集。称为Open Instruction Generalist Dataset，该数据集包含超过 4000 万个问题和答案示例、后续问题以及更多旨在“教”模型如何响应不同指令（例如“为历史论文写大纲内战”）。

为了征求反馈，Together 发布了一个演示，任何人都可以使用该演示与 OpenChatKit 模型进行交互。

“主要动机是让任何人都可以使用 OpenChatKit 来改进模型以及创建更多特定于任务的聊天模型，”Prakash 补充道。“虽然大型语言模型在回答一般问题方面表现出令人印象深刻的能力，但在针对特定应用程序进行微调时，它们往往会达到更高的准确性。”

Prakash 表示，这些模型可以执行一系列任务，包括解决基本的高中数学问题、生成 Python 代码、撰写故事和总结文档。那么他们经得起考验的情况如何？好吧，根据我的经验——至少在基本的事情上，比如写听起来似是而非的求职信。

但是有一个非常明确的限制。继续与 OpenChatKit 模型聊天足够长的时间，它们就会开始遇到与 ChatGPT 和其他最近的聊天机器人一样的问题，比如鹦鹉学舌地提供虚假信息。例如，我让 OpenChatKit 模型给出了关于地球是否平坦的矛盾答案，以及关于谁赢得 2020 年美国总统大选的完全错误的陈述。

OpenChatKit 模型在其他不太令人担忧的领域较弱，例如上下文切换。在谈话中改变话题通常会使他们感到困惑。他们也不是特别擅长创意写作和编码任务，有时会无休止地重复他们的回答。

Prakash 将此归咎于训练数据集，他指出这是一项正在进行的积极工作。“这是一个我们将继续改进的领域，我们已经设计了一个开放社区可以积极参与其中的流程，”他说，指的是演示。

OpenChatKit 回答的质量可能有待改进。（公平地说，根据提示，ChatGPT 并没有明显好转。）但是 Together正在积极主动——或者至少试图主动——在审核方面。

虽然一些类似于 ChatGPT聊天机器人可能会被提示写有偏见或仇恨的文本，但由于它们的训练数据（其中一些来自有毒来源），OpenChatKit 模型更难强制。我的设法让他们写了一封网络钓鱼电子邮件，但他们不会被引诱到更有争议的领域，比如支持大屠杀或证明为什么男性比女性更适合做 CEO。

不过，审核是 OpenChatKit 的一个可选功能——开发人员不需要使用它。根据 Prakash 的说法，虽然其中一个模型是为另一个更大的模型（为演示提供动力的模型）“专门设计为护栏”，但更大的模型默认情况下没有应用过滤。

这与 OpenAI、Anthropic 和其他公司青睐的自上而下方法不同，后者涉及在 API 级别结合人工和自动调节和过滤。Prakash 认为，从长远来看，这种幕后的不透明性可能比 OpenChatKit 缺乏强制性过滤器更有害。

“与许多两用技术一样，人工智能当然可以用于恶意环境。这对于开放式人工智能或通过 API 商业化的封闭系统来说是正确的，”Prakash 说。“我们的论点是，开放研究社区对生成人工智能技术的审计、检查和改进越多，我们作为一个社会就能更好地为这些风险提出解决方案。我们认为，如果大型人工智能生成模型的力量完全掌握在少数大型科技公司手中，无法进行审计、检查或理解，那么风险会更大。”

强调 Prakash 关于开放式开发的观点，OpenChatKit 包括第二个训练数据集，称为 OIG-moderation，旨在解决一系列聊天机器人调节挑战，包括机器人采用过于激进或压抑的语气。（参见：Bing Chat。）它被用来训练 OpenChatKit 中两个模型中较小的一个，Prakash 说 OIG-moderation 可以应用于创建其他模型，如果开发人员选择这样做，可以检测并过滤掉有问题的文本。

“我们非常关心 AI 安全，但我们认为从长远来看，通过默默无闻来确保安全是一种糟糕的方法。开放、透明的姿态被广泛接受为计算机安全和密码学领域的默认姿态，我们认为如果我们要构建安全的 AI，透明度将是至关重要的，”Prakash 说。“维基百科很好地证明了开放社区如何成为应对大规模挑战性审核任务的绝佳解决方案。”

我不确定。对于初学者来说，维基百科并不完全是黄金标准——该网站的审核过程以不透明和地域性着称。然后，开源系统经常被滥用（而且很快）。以生成图像的 AI 系统 Stable Diffusion 为例，在其发布后的几天内，4chan 等社区就在使用该模型——其中还包括可选的审核工具——来制作非自愿的著名演员色情深度造假。

OpenChatKit 的许可证明确禁止诸如生成错误信息、宣扬仇恨言论、发送垃圾邮件以及参与网络欺凌或骚扰等用途。但是没有什么可以阻止恶意行为者忽略这些条款和审核工具。

预料到最坏的情况，一些研究人员已经开始对开放式聊天机器人发出警告。

NewsGuard 是一家追踪在线错误信息的公司，在最近的一项研究中发现，较新的聊天机器人，特别是 ChatGPT，可能会被提示编写内容来宣传有关疫苗的有害健康声明，模仿来自中国和俄罗斯的宣传和虚假信息，并呼应党派新闻媒体的基调. 根据这项研究，当被要求根据错误和误导性的想法撰写回复时，ChatGPT 在大约 80% 的情况下都能做到。

作为对 NewsGuard 调查结果的回应，OpenAI 在后端改进了 ChatGPT 的内容过滤器。当然，这对于像 OpenChatKit 这样的系统来说是不可能的，它把保持模型更新的责任放在了开发人员身上。

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun219824.html

人工智能开源中国聊天机器人

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

修复：不支持设备类型错误 Realtek 音频管理器

上一篇 2023年3月14日下午8:55

Chat GPT-4 将让您将文本转换为视频，下周即将推出

下一篇 2023年3月14日下午11:29

谷歌Google

谷歌正在将 SGE AI 摘要扩展到美国的更多用户，即使他们没有注册

美国的一些用户开始在搜索页面顶部获得人工智能生成的查询摘要。新的搜索从顶部结果中提取信息，提供参考链接和图像，并以一口大小的句子总结信息，使用户能够快速获得查询的答案。这可能会让…

2024年4月6日
最新资讯

Threads 在美国推出了一项新的“Trending Now”功能

美国的 Threads 用户已开始在他们的 Feed 中看到一个新的“Trending Now”部分。在这里，用户可以找到热门话题，这些话题正在激发平台上越来越多的对话。Trend…

2024年4月2日
新的人工智能模型可以在有限的人工干预下相互交谈和学习

人工智能系统正在快速发展。发表在《自然》杂志上的一篇新论文强调了人工智能网络的发展，该网络不仅可以仅依靠书面指令来学习和执行任务，还可以教另一个没有此类指令或经验的“姐妹”人工智能…

工具软件 2024年4月2日
工具软件

Mistral AI 创始人 Arthur Mensch 讨论开源 AI

Mistral AI 创始人 Arthur Mensch 讨论开源 AI 在 AI Ascent 大会上，Mistral AI 的创始人 Arthur Mensch 提出了一个令人…

2024年3月29日
工具软件

创建可信赖 AI 模型的 5 个基本原则

创建可信赖 AI 模型的 5 个基本原则随着人工智能（AI）越来越多地渗透到我们的生活中，对这些系统的信任变得至关重要。IBM 概述了五项基本原则，这些原则对于创建 AI 模…

2024年3月29日
微软Microsoft

微软为厂商定义 AI PC：必须配备 Copilot 键

英特尔、微软、高通以及 AMD 等科技巨头，近月来一直在推广所谓的「AI PC」概念。虽然我们仍在等待微软就其Windows中人工智能大计的更多细节进行分享，英特尔已开始公布微软…

2024年3月29日
工具软件

NVIDIA 和 AI 个人计算的未来

NVIDIA 和 AI 个人计算的未来 NVIDIA 应用深度学习研究副总裁 Bryan Catanzaro 和 Imbue 首席执行官 Kanjun Qiu 在最近的一次采访中解…

2024年3月26日
我该使用哪款 AI？AI 模型的超能力与现状

一年多来，GPT-4 一直是占主导地位的 AI 模型，显然比任何其他可用的 LLM 系统都要聪明得多。这种情况在上个月发生了变化，现在有三个GPT-4级模型，它们都为自己的聊天机器…

2024年3月26日 • 工具软件
工具软件

有关 OpenAI Q-STAR 的更多细节揭晓

有关 OpenAI Q-STAR 的更多细节揭晓关于 OpenAI 的 Q-STAR 有一个未经证实的泄漏，这是一个对话系统，据说利用基于能量的模型（EBM）来生成响应。据报…

2024年3月24日
工具软件

如何在没有互联网连接的情况下私下运行人工智能

如何在没有互联网连接的情况下私下运行人工智能如果您正在寻找一种方式，在您自己的本地计算机或家庭网络上享受触手可及的人工智能（AI）的力量，而不必担心损害您的隐私。您现在可以在…

2024年3月15日
工具软件

如何使用 AI 通过日志行集思广益书籍故事情节

如何使用 AI 通过日志行集思广益书籍故事情节如果你想利用人工智能的力量来帮助你集思广益你的下一本书的想法或故事情节，你可能会对一种新的头脑风暴技术感兴趣，这种技术专注于布莱克·…

2024年3月15日
工具软件

Figure01 搭载ChatGPT视觉和语音转语音通信的机器人

Figure01 搭载ChatGPT视觉和语音转语音通信的机器人想象一下，在这个世界里，配备人工智能的人形机器人不仅可以与您交谈，还可以像人一样理解周围的环境并与之互动。Open…

2024年3月15日
工具软件

我们对 ChatGPT-5 有什么期待？

我们对 ChatGPT-5 有什么期待？伊戈尔·波加尼（Igor Pogany）最近发表了演讲，重点介绍了ChatGPT-5等语言模型未来迭代的预期进步和能力，以及个人和企业准备…

2024年3月15日
工具软件

Cognition Labs Devin AI 软件工程师详解

Cognition Labs Devin AI 软件工程师详解认识 Devin，这是人工智能领域的突破性发展，被誉为世界上第一位完全自主的 AI 软件工程师。这不仅仅是任何人工智…

2024年3月14日
工具软件

如何使用 ElevenLabs 制作 AI 音效

如何使用 ElevenLabs 制作 AI 音效如果您正在寻找一种使用人工智能（AI）快速轻松地创建丰富不同音效以满足您所有需求的方法。在查看 ElevenLabs 的 AI…

2024年3月14日
工具软件

Devin 是世界上第一位自主 AI 软件工程师

Devin 是世界上第一位自主 AI 软件工程师 Cognition Labs 推出了 Devin，这是第一位能够独立执行复杂软件工程任务的自主 AI 软件工程师。Devin 被设…

2024年3月14日
最新资讯

Intel 高层解释甚么是 AI PC？

据Intel的技术营销高级总监Robert Hallock的解释，只要一台个人电脑（PC）内含有GPU、具备神经处理单元的处理器，并且能够处理向量神经网络指令VNNI与DP4a指令…

2024年3月14日
工具软件

用人工智能写书以及你可以期待什么

人工智能（AI）的出现正在重塑书籍写作的世界。对于那些正在考虑在写作中使用人工智能的人来说，重要的是要掌握这种技术援助带来的优势和挑战。根据他创作哥特式奇幻小说《德古拉的继承人…

2024年1月3日
工具软件

2024 年随着人工智能的发展而出现的网络安全趋势

随着我们进入 2024 年，网络安全格局正在快速发展。随着时间的流逝，网络威胁的复杂性与日俱增，对强大的安全措施的需求变得更加迫切。在这个瞬息万变的数字世界中，个人和组织都必须随时…

2024年1月2日
工具软件

如何通过 AI 角色扮演和 ChatGPT 学习有效的沟通技巧

有效的沟通技巧是基础，在个人互动和专业合作的动态中起着举足轻重的作用。在我们日益相互联系的世界中，清晰地表达思想、理解他人和进行有意义的对话的能力是必不可少的。人工智能（AI） …

2024年1月2日
工具软件

人工智能（AI）将在 2024 年发展的 4 个领域

2023 年，人工智能（AI）出现了巨大的爆炸式增长，OpenAI、Microsoft、Google 等公司发布了丰富的 AI 模型和服务，为我们将利用 AI 力量的新未来铺平…

2024年1月2日
工具软件

Apple 发布 Ferret 7B 多模态大型语言模型（MLLM）

Apple 最近推出了 Ferret 7B，这是一种复杂的大型语言模型（LLM），代表了人工智能领域向前迈出的重要一步。这项新技术证明了 Apple 对推进 AI 的承诺，并将公…

2024年1月2日
工具软件

使用 Google Bard 提升您的生活：2024 年生产力终极指南

感觉被淹没了？就好像您正沉沦在无休止的任务和待办事项清单的浪潮中，无法跟上我们技术驱动时代快速发展的需求？振作起来，无畏的数字海洋航海家，因为一个强大的新伙伴已经到来，加入你的任务…

2023年12月30日
云服务提供商对人工智能初创公司的战略投资，以及相关的会计影响，将受到监管机构的挑战

云服务提供商对人工智能初创公司的战略投资，以及相关的会计影响，将受到监管机构的挑战今年，大型科技公司向人工智能初创公司注入了一股投资资金浪潮。微软在1月份向OpenAI投资了1…

工具软件 2023年12月30日
另一种替代transformer架构将得到有意义的采用。

另一种替代transformer架构将得到有意义的采用。引入自2017年谷歌的一篇重要论文中，transformer架构是当今人工智能技术中的主导范式。目前存在的每个主要生成式人…

工具软件 2023年12月30日

认识开发开源 ChatGPT 替代方案的团队

相关推荐