使用Vicuna-13B构建聊天机器人，这是一个经过对话训练的开源LLM

2023年8月8日上午9:34 • 工具软件

使用 Vicuna-13b（一种根据用户共享的真实聊天进行训练的模型）来创建 AI 产品和演示。

深入了解骆马模型，非常适合聊天机器人和其他对话应用程序。

初创公司的创始人和建设者，您是否希望为您的用户创造神奇的对话体验？想要构建感觉几乎人性化的聊天机器人吗？好吧，让我向您介绍 Vicuna-13B – 一种开源对话式 AI 模型，可以帮助您实现愿景。

在初创公司的世界里，确定产品与市场的契合度就是一切。实现这一目标的最佳方法之一是创造令人愉悦的用户体验。这就是对话式AI的用武之地。由 Vicuna-13B 等大型语言模型提供支持的聊天机器人和虚拟助手可帮助您：

更好地了解用户：与用户进行自然对话，以深入了解他们的需求、痛点和动机。
引导用户：使用智能助手引导用户完成复杂的任务和工作流程。减少注册、入职和交易的流失。
吸引和留住用户：通过由 AI 提供支持的消息传递和通知，打造养成习惯的产品体验。
在竞争中脱颖而出：除了基本的常见问题解答和脚本之外，还有类似人类的对话体验，让您的用户惊叹不已。

但大多数大型语言模型都是专有的，无法访问。这就是Vicuna-13B闪耀的地方。让我们探讨如何利用它来将您的创业公司提升到一个新的水平。

Vicuna-13B的工作原理：对真实对话进行微调

Vicuna-13B 是通过在 ChatGPT 的 70，000 个真实多回合对话上微调强大的 LLaMA 架构而构建的。这种对话数据有助于它自然地处理聊天机器人交互。

根据评估，Vicuna-13B达到了ChatGPT质量的90%以上，同时优于其他公开型号。关键是它在真实对话中的训练使对话具有上下文、自然和人性化。

使用案例：构建更智能的产品

以下是您可以使用Vicuna-13B将对话智能注入产品的一些方法：

智能聊天机器人：创建可以回答复杂问题、推荐产品和进行诙谐对话的聊天机器人。
对话式商务：指导用户完成交易，同时回答问题。减少购物车放弃。
超个性化：使用对话数据了解用户需求并提供个性化内容和建议。
自动化支持：自动执行常见支持查询，以更快地解决客户问题。将人工代理集中在复杂的工单上。
创建内容：自动为登录页面、博客、电子邮件等创建内容。通过描述您的需求。

最好的部分是开始使用Vicuna-13B很容易。你不需要人工智能博士。只需阅读本文即可了解如何使用它。

它是如何工作的？训练Vicuna-13B 与真正的聊天GPT对话

Vicuna-13B 是通过在从 ShareGPT.com 收集的大约 70，000 个多回合对话的数据集上微调 LLaMA 架构而构建的。这些对话包含用户如何与 ChatGPT 交互的真实示例，有助于教模型自然交谈。

训练过程增强了斯坦福大学的 Alpaca 模型，以处理更长的对话上下文并优化 GPU 内存使用。通过梯度检查点等改进，研究人员能够在一天内在 13 个 A8 GPU 上训练 Vicuna-100B，同时通过利用现货实例保持低成本。

根据使用 GPT-4 作为评委的初步评估，Vicuna-13B 的质量达到了 ChatGPT 和谷歌Bard模型的 90% 以上。在超过90%的测试用例中，它还优于LLaMA和Alpaca等其他公开可用的模型。

这证明了将像LLaMA这样的坚实基础与真实的对话数据相结合以产生先进的开源聊天机器人的力量。

Vicuna-13B的局限性

虽然 Vicuna-13B 是一种功能强大且用途广泛的聊天机器人模型，但它确实有一些用户应该注意的限制：

响应准确性：与任何语言模型一样，Vicuna-13B的响应可能并不总是完全准确的。它可以产生听起来合理的答案，但偶尔可能会产生不正确或荒谬的回答。
上下文理解：虽然Vicuna-13B能够在一定程度上处理多回合对话，但它可能仍然难以处理冗长而复杂的对话。在这种情况下，模型可能会丢失上下文并生成不太相关的响应。
偏差和公平性：与许多语言模型一样，Vicuna-13B 可能会无意中反映训练数据中存在的偏差。在某些情况下，这可能会导致有偏见或不公平的响应，尤其是在训练数据包含有偏见的语言或观点的情况下。
计算资源：Vicuna-13B是一个大型语言模型，运行它需要大量的计算资源，特别是用于微调和服务。计算能力有限的用户在部署模型时可能会面临挑战。
微调数据：Vicuna-13B的性能在很大程度上依赖于微调数据的质量和多样性。如果用于微调的数据集有限或不具有代表性，则模型的性能可能会受到影响。
道德使用：与任何人工智能模型一样，以合乎道德和负责任的方式使用 Vicuna-13B 至关重要。避免出于恶意目的部署模型、传播错误信息或生成有害内容。
商业用途限制：Vicuna-13B仅用于研究和非商业用途。该模型的商业应用可能会违反使用限制和服务条款。
评估框架：包括Vicuna-13B在内的聊天机器人性能评估仍然是一个复杂且不断发展的领域。使用 GPT-4 进行的初步评估很有见地，但可能无法捕捉到模型性能的所有细微差别。

了解这些限制将有助于用户在将Vicuna-13B纳入其项目和应用程序时做出明智的决定。随着人工智能技术的不断发展，解决这些限制并努力持续改进对于追求更强大和负责任的人工智能模型至关重要。

了解Vicuna-13B的输入和输出

在我们深入研究使用 Vicuna-13B 解决特定问题之前，了解其输入和输出至关重要。该模型采用多个影响其行为的输入，并生成响应作为其输出。以下是关键输入：

提示：提示是提供给Vicuna-13B的初始文本，作为生成响应的起点。
Max_length：此参数限制生成的响应中的最大令牌数。
温度：温度控制输出的随机性。值越高，响应越随机，而值越低，响应的确定性越强。
Top_p：解码文本时，此参数从最有可能的标记的前 p 百分比中采样。较低的值会筛选出不太可能的令牌。
Repetition_penalty：对生成的文本中重复单词的惩罚;1 表示不惩罚，大于 1 的值不鼓励重复，小于 1 鼓励重复。
种子： 用于随机数生成器的种子，用于可重复性
调试：一个布尔值，用于在日志中提供调试输出

至于输出，Vicuna-13B 以字符串的 JSON 数组的形式生成响应。下面是它的样子：

{
  "type": "array",
  "items": {
    "type": "string"
  },
  "title": "Output",
  "x-cog-array-type": "iterator",
  "x-cog-array-display": "concatenate"
}

分步指南：使用 Vicuna-13B 增强您的聊天机器人

现在，让我们探索如何利用 Vicuna-13B 来增强您的聊天机器人。

无论你是否是开发人员，都可以通过多种方式与模型进行交互。如果您不喜欢编码，只是想试一试，请查看模型演示。

如果您已准备好开始编码，以便最终将骆马实施到您的产品中，则可以使用复制 API。以下是分步指南：

步骤 1：安装 Node.js 客户端并进行身份验证

首先，通过运行来安装 Node.js 客户端。接下来，从 AIModels.fyi 上的帐户设置中复制您的 API 令牌，并将其设置为环境变量：。npm install replicateexport REPLICATE_API_TOKEN=YOURTOKEN

步骤 2：运行模型

设置 Node.js 客户端和 API 令牌后，现在可以使用以下代码运行模型：

import Replicate from "replicate";

const replicate = new Replicate({ auth: process.env.REPLICATE_API_TOKEN });

const output = await replicate.run(
  "replicate/vicuna-13b:6282abe6a492de4145d7bb601023762212f9ddbbe78278bd6771c8b3b2f2a13b",
  {
    input: {
      prompt: "Your chatbot prompt here..."
    }
  }
);

步骤 3：设置 Webhook（可选）

如果您希望在预测完成后收到通知，可以设置 Webhook URL。这对于实时应用程序是有益的。

例如：

const prediction = await replicate.predictions.create({
  version: "6282abe6a492de4145d7bb601023762212f9ddbbe78278bd6771c8b3b2f2a13b",
  input: {
    prompt: "Your chatbot prompt here..."
  },
  webhook: "https://example.com/your-webhook",
  webhook_events_filter: ["completed"]
});

通过执行以下步骤，您将能够与 Vicuna-13B 互动，并见证其令人印象深刻的聊天功能。

比较Vicuna-13B与类似型号：羊驼和LLaMA 7B

Vicuna-13B，Alpaca和LLaMA 7B都是擅长各种自然语言处理任务的语言模型。让我们探讨一下它们的异同：

Vicuna-13B

Vicuna-13B是一个强大的语言模型，在ChatGPT交互上进行了微调。它旨在生成类似人类的响应，使其适用于基于聊天的对话、问答和基于文本的推荐系统。该模型可以有效地响应用户查询，进行有意义的对话，并根据用户偏好提供个性化推荐。在此处查看与LLaMA的比较文章。

Alpaca

Alpaca 是另一个指令遵循模型，由 LLaMA 7B 模型在 52K 指令遵循演示中微调。它的行为在质量上类似于OpenAI的text-davinci-003，同时令人惊讶地小，易于复制/便宜。Alpaca 旨在根据提供给它的特定指令生成响应，使其适用于需要基于指令的语言生成的任务。

LLaMA 7B

LLaMA（和新的LLaMA v2）是使用转换器实现的语言模型。它被训练为根据从大型数据集中学习的模式和信息来理解和生成类似人类的文本。LLaMA 7B 具有广泛的用例，包括语言生成、文本完成和语言理解任务。它可用于撰写文章、为虚拟角色生成对话、预测打字、聊天机器人和语言翻译系统。您可能会喜欢这篇文章，将LLaMA-v2-Chat与Alpaca进行比较。

使用案例

Vicuna-13B：骆马擅长基于聊天的对话、问答和基于文本的推荐系统。它是创建交互式和引人入胜的聊天机器人以及对用户问题提供准确回答的理想选择。
羊驼：羊驼专门从事教学任务。它可以遵循提供给它的特定指令，并根据这些指令生成响应。
LLaMA 7B：LLaMA 7B是一种多功能语言模型，能够执行各种语言任务，包括文本生成、文本完成和语言理解。它可以应用于多种应用程序，例如内容生成、预测键入和摘要。

技术实施

Vicuna-13B和Alpaca都使用微调技术来增强基于特定数据集和任务的性能。
LLaMA 7B是使用Transformers实现的，Transformers是一种深度学习模型，以其在自然语言处理任务中的成功而闻名。

每个模型都有其独特的限制，应根据特定的用例和要求来考虑这些限制。

总之，Vicuna-13B，Alpaca和LLaMA 7B是具有独特优势和应用的强大语言模型。虽然 Vicuna-13B 在基于聊天的对话和问答中大放异彩，但 Alpaca 是遵循指令任务的理想选择。另一方面，LLaMA 7B的多功能性使其可用于广泛的语言相关应用。在选择最合适的模型时，必须考虑特定的用例和所需的语言任务类型。

使用 AIModels.fyi 查找相似模型

AIModels.fyi是发现满足各种创意需求的AI模型的宝贵资源。如果您有兴趣查找类似于Vicuna-13B的型号，可以使用AIModels.fyi按照以下步骤操作：

第 1 步：访问 AIModels.fyi

前往AIModels.fyi开始搜索类似的型号。

第 2 步：使用搜索栏

使用页面顶部的搜索栏搜索具有与您的用例相关的特定关键字的模型。例如，如果您正在寻找类似于 Vicuna-13B 的聊天机器人模型，您可以尝试使用“聊天机器人”、“对话”或“问答”等关键字。

步骤 3：筛选结果

在搜索结果页面的左侧，您会找到几个过滤器，可帮助您缩小模型列表的范围。您可以按类型（例如，图像到图像、文本到图像）、成本、受欢迎程度或特定创建者对模型进行筛选和排序。

例如，如果您正在寻找基于文本的聊天机器人模型，您可以通过选择“文本到文本”类型来过滤模型。此外，您可以按受欢迎程度或成本对模型进行排序，以找到最广泛使用或预算友好的选项。

第 4 步：浏览结果

浏览搜索结果以找到引起您兴趣的模型。单击每个型号的名称以访问其详细信息页面，其中包括功能、用例、技术规格等。

第 5 步：比较并选择

比较您入围的模型的特性和功能。考虑响应准确性、上下文理解、计算要求和道德考虑等因素。这将帮助您确定哪种模型最符合您的特定需求和用例。

使用 AIModels.fyi，您可以有效地探索和比较各种 AI 模型，使您能够做出明智的决策并为您的创意项目选择最合适的模型。

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun247876.html

模型聊天机器人语言

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

使用 AudioLDM 合成音效、音乐和对话的构建器指南

上一篇 2023年8月8日上午9:28

Grading Vicuna：用于聊天AI的Llama，Alpaca和ChatGPT的开源替代品

下一篇 2023年8月8日上午9:35

如何在 Opera One Developer 上启用和使用本地 AI 模型

Opera 最近宣布将本地 AI 模型集成到其 Opera One 浏览器中。随着这一发展，Opera 成为第一个内置 AI 模型的主要浏览器，您现在可以从 150 个大型语言模型…

2024年4月6日 • 工具软件
工具软件

Stability AI 引入的 StableCode Instruct 3B 编码 AI 模型

Stability AI 引入的 StableCode Instruct 3B 编码 AI 模型 Stability AI 推出了 StableCode Instruct 3B，这…

2024年3月28日
工具软件

Open-Sora 开源替代 OpenAI 的 Sora 文本转视频 AI

Open-Sora 开源替代 OpenAI 的 Sora 文本转视频 AI 继今年早些时候推出 Sora 之后，OpenAI 强大的文本到视频 AI 模型以 Open-Sora 的…

2024年3月26日
工具软件

OpenAI Q Star 理论 AI 模型解读

OpenAI Q Star 理论 AI 模型解读如果您有兴趣了解有关 OpenAI Q* Star AI 模型的更多信息，该模型显然正在开发中。本快速指南概述了我们目前所知道…

2024年3月26日
我该使用哪款 AI？AI 模型的超能力与现状

一年多来，GPT-4 一直是占主导地位的 AI 模型，显然比任何其他可用的 LLM 系统都要聪明得多。这种情况在上个月发生了变化，现在有三个GPT-4级模型，它们都为自己的聊天机器…

2024年3月26日 • 工具软件
DepthFM: 使用深度流匹配技术的快速单目深度预测

DepthFM: 使用深度流匹配技术的快速单目深度预测一个深度图分析模型，通过流匹配（Flow Matching）技术，可以有效地实现这一目标，因为它在解空间中形成的直线轨迹既高…

工具软件 2024年3月26日
VoiceCraft：超过XTTS的语音模型

VoiceCraft：超过XTTS的语音模型 VOICECRAFT模型介绍： VOICECRAFT是一个先进的神经编解码语言模型，专门用于语音编辑和零样本文本到语音（TTS）任务。…

工具软件 2024年3月26日
字节发布了AnimateDiff-Lightning 模型

字节发布了AnimateDiff-Lightning 模型字节发布了AnimateDiff-Lightning 模型，只需要 4-8 步的推理就可以生成质量非常不错的视频。跟 …

工具软件 2024年3月26日
工具软件

Suno 发布了自己的歌曲生成模型V3版本

Suno 发布了自己的歌曲生成模型V3版本 Suno 正式发布了他们的 V3 音乐生成模型，现在所有人都可以使用。 V3 改进的内容主要是： ◦ 音质更佳，带来更加清晰动听的音频体…

2024年3月26日
工具软件

有关 OpenAI Q-STAR 的更多细节揭晓

有关 OpenAI Q-STAR 的更多细节揭晓关于 OpenAI 的 Q-STAR 有一个未经证实的泄漏，这是一个对话系统，据说利用基于能量的模型（EBM）来生成响应。据报…

2024年3月24日
如何将键盘设置更改为默认值 Windows 11？

如果您遇到键盘问题，则需要将键盘设置重置为默认值。在本指南中，我们将讨论将键盘设置更改回正常状态的步骤。如何将键盘设置更改回正常？ 1. 再次选择首选语言按 + 打开“设置”应…

2024年3月18日 • Win 11
工具软件

GFlowNets是人工智能的未来吗，它们是什么？

GFlowNets是人工智能的未来吗，它们是什么？ GFlowNets 是在 Yoshua Bengio 的指导下开发的，代表了人工智能（AI）领域的一种新颖训练算法，与 Tr…

2024年3月15日
工具软件

Stable Diffusion 和 ComfyUI AI 艺术生成器初学者指南

Stable Diffusion 和 ComfyUI AI 艺术生成器初学者指南如果您想开始使用 Stable Diffusion 和 ComfyUI，乍一看非常复杂。您会很高兴…

2024年3月15日
工具软件

OpenAI 首席技术官透露可能的 Sora AI 视频生成器发布日期

OpenAI 首席技术官透露可能的 Sora AI 视频生成器发布日期 OpenAI 首席技术官（CTO） Mira Murati 在接受《华尔街日报》采访时，对 OpenAI …

2024年3月15日
在 iPhone 上更改语言的 3 种方法

众所周知，iPhone 是所有电子产品中最人性化的，其中一个原因是它们可以根据您的喜好轻松进行个性化设置。在您可以个性化的内容中，您可以将语言更改为其他语言，这与您在设置 iPho…

2024年1月20日 • 苹果Apple
工具软件

展示了新的 Runway AI 文本到视频环境运动控制功能

Runway 是一种文本到视频的 AI 服务，它正在改变我们创建视频和动画的方式，它具有强大的新功能，允许用户以令人难以置信的精度为静态图像添加运动。这种环境控制设置对于使用该平台…

2024年1月2日
工具软件

I2V-Adapter：直接从图片生成视频

I2V-Adapter：直接从图片生成视频快手也发布了一个视频生成模型 I2V-Adapter。主要用于从图片获取信息直接生成视频，这个项目可以与已有的 SD 生态比如Conto…

2024年1月2日
“大型语言模型”和“LLM”这些术语将变得不那么常见

“大型语言模型”和“LLM”这些术语将变得不那么常见在当今人工智能领域，“大型语言模型”（及其缩写LLM）经常被用作“任何先进人工智能模型”的简称。这是可以理解的，因为许多最初崭…

工具软件 2023年12月30日
最先进的封闭模型将继续以显著优势胜过最先进的开放模型

最先进的封闭模型将继续以显著优势胜过最先进的开放模型当今人工智能讨论中的一个重要话题是围绕开源和闭源人工智能模型的辩论。虽然大多数尖端人工智能模型开发者——如OpenAI、Goo…

工具软件 2023年12月30日
工具软件

OpenAI 正式推出的 6 个 ChatGPT 提示工程原理

OpenAI 最近推出了一份有价值的指南，旨在帮助用户充分利用与 ChatGPT 的互动。对于任何希望从 AI 获得更精确和相关答案的人来说，本指南都是一个重要的资源，无论他们的技…

2023年12月28日
工具软件

OpenAI 正式推出的 6 个 ChatGPT 提示工程原理

OpenAI 最近推出了一份有价值的指南，旨在帮助用户充分利用与 ChatGPT 的互动。对于任何希望从 AI 获得更精确和相关答案的人来说，本指南都是一个重要的资源，无论他们的技…

2023年12月28日
工具软件

如何微调 Mixtral 8x7B Mistral Ai Mixture of Experts （MoE） AI 模型

当谈到增强 Mixtral 8x7B 的功能时，Mixtral 8x7B 是一种拥有惊人的 870 亿个参数的人工智能模型，这项任务似乎令人生畏。该模型属于专家混合（MoE）类…

2023年12月26日
微软Microsoft

Microsoft Bing Chat 免费获得 ChatGPT-4 Turbo，Code Interpreter 即将迎来重大升级

您现在可以在 Bing Chat （Microsoft Copilot）上免费使用 ChatGPT-4 Turbo 以及插件支持。 Microsoft 正在推出 Bing Cha…

2023年12月26日
TextDiffuser-2：为文本渲染释放语言模型的力量

TextDiffuser-2：为文本渲染释放语言模型的力量可以稳定在扩散模型中生成指定位置和风格的英文文本，它是借助的微调后的大语言模型来规划文本布局，以及编码文本的位置。

工具软件 2023年12月26日
工具软件

Tripo3d：AI生成3D模型

Tripo3d：AI生成3D模型可以说是现在最强大的3D模型生成工具，一经发布就把几个老牌产品打趴了，支持从文字直接生成3D模型，也支持图片生成。

2023年12月26日