开放助手 LLaMa 30B SFT 6

2023年4月28日下午5:58 • 工具软件

开放助手 LLaMa 30B SFT 6

由于 Meta AI 对 LLaMA 模型附加了许可证，因此无法直接分发基于 LLaMA 的模型。相反，我们为OA模型提供了XOR权重。

感谢 Mick 编写了启用此过程的脚本xor_codec.py

过程

注意：此过程适用于模型。将来可以将相同的过程应用于其他模型，但校验和会有所不同。oasst-sft-6-llama-30b

此过程仅在Linux（特别是Ubuntu）上进行测试。一些用户报告说，该过程在Windows上不起作用。如果只有一台 Windows 计算机，我们建议使用 WSL。

要使用基于 OpenAssistant LLaMA 的模型，您应该拥有原始 LLaMA 模型权重的副本，并将它们添加到此处的子目录中。如果您无法获得原始LLaMA，请参阅下面的斜体注释以获取可能的替代方案。llama

确保您的 LLaMA 30B 检查点与正确的 md5sum 匹配：

f856e9d99c30855d6ead4d00cc3a5573  consolidated.00.pth
d9dbfbea61309dc1e087f5081e98331a  consolidated.01.pth
2b2bed47912ceb828c0a37aac4b99073  consolidated.02.pth
ea0405cdb5bc638fee12de614f729ebc  consolidated.03.pth
4babdbd05b8923226a9e9622492054b6  params.json

如果您没有原始LLaMA权重的副本并且无法获得，您仍然可以完成此过程。一些用户报告说，该模型可以用作异或转换的基础。这也将允许您跳到步骤 7。但是，我们仅支持从 LLaMA 原始检查点开始的转换，如果您在使用此替代方法时遇到问题，则无法提供支持。

重要提示：请按照以下确切步骤将原始LLaMA检查点转换为与HuggingFace Transformers兼容的格式。如果您使用任何依赖项的错误版本，则最终可能会得到与 XOR 文件不兼容的权重。

创建一个干净的Python 3.10虚拟环境并激活它：

python3.10 -m venv xor_venv
source xor_venv/bin/activate

克隆变压器存储库并切换到测试版本：

git clone https://github.com/huggingface/transformers.gitcd transformersgit checkout d04ec99bec8a0b432fc03ed60cea9a1a20ebaf3cpip install .

完全安装以下依赖项版本：

pip install torch==1.13.1 accelerate==0.18.0 sentencepiece==0.1.98 protobuf==3.20.1

检查输出：pip freeze

accelerate==0.18.0certifi==2022.12.7charset-normalizer==3.1.0filelock==3.12.0huggingface-hub==0.13.4idna==3.4numpy==1.24.2nvidia-cublas-cu11==11.10.3.66nvidia-cuda-nvrtc-cu11==11.7.99nvidia-cuda-runtime-cu11==11.7.99nvidia-cudnn-cu11==8.5.0.96packaging==23.1protobuf==3.20.1psutil==5.9.5PyYAML==6.0regex==2023.3.23requests==2.28.2sentencepiece==0.1.98tokenizers==0.13.3torch==1.13.1tqdm==4.65.0transformers @ file:///mnt/data/koepf/transformerstyping_extensions==4.5.0urllib3==1.26.15

在存储库根目录中，运行 HF LLaMA 转换脚本：transformers

python src/transformers/models/llama/convert_llama_weights_to_hf.py --input_dir <input_path_llama_base>  --output_dir <output_path_llama30b_hf> --model_size 30B

在转换目标目录（）中运行。如果您的文件正确，这应该产生以下校验和：find . -type f -exec md5sum "{}" +output_dir

462a2d07f65776f27c0facfa2affb9f9  ./pytorch_model-00007-of-00007.bine1dc8c48a65279fb1fbccff14562e6a3  ./pytorch_model-00003-of-00007.bin9cffb1aeba11b16da84b56abb773d099  ./pytorch_model-00001-of-00007.binaee09e21813368c49baaece120125ae3  ./generation_config.json92754d6c6f291819ffc3dfcaf470f541  ./pytorch_model-00005-of-00007.bin3eddc6fc02c0172d38727e5826181adb  ./pytorch_model-00004-of-00007.bineeec4125e9c7560836b4873b6f8e3025  ./tokenizer.model99762d59efa6b96599e863893cf2da02  ./pytorch_model-00006-of-00007.bin598538f18fed1877b41f77de034c0c8a  ./config.jsonfdb311c39b8659a5d5c1991339bafc09  ./tokenizer.jsonfecfda4fba7bfd911e187a85db5fa2ef  ./pytorch_model.bin.index.jsonedd1a5897748864768b1fab645b31491  ./tokenizer_config.json6b2e0a735969660e720c27061ef3f3d3  ./special_tokens_map.json5cfcb78b908ffa02e681cce69dbe4303  ./pytorch_model-00002-of-00007.bin

重要提示：您现在应该拥有正确的 LLaMA 权重，并准备好应用 XOR。如果上面的校验和与您的校验和不匹配，则存在问题。

获得正确格式的LLaMA权重后，您可以应用异或解码：

python xor_codec.py oasst-sft-6-llama-30b/ oasst-sft-6-llama-30b-xor/oasst-sft-6-llama-30b-xor/ llama30b_hf/

您应该会在执行期间看到一条警告消息：

Exception when processing 'added_tokens.json'

这是正常的。如果其他文件出现类似消息，则表示出了问题。

现在在输出目录中运行（此处）。您应该得到一个包含以下校验和的文件：find . -type f -exec md5sum "{}" +oasst-sft-6-llama-30b

970e99665d66ba3fad6fdf9b4910acc5  ./pytorch_model-00007-of-00007.bin
659fcb7598dcd22e7d008189ecb2bb42  ./pytorch_model-00003-of-00007.bin
ff6e4cf43ddf02fb5d3960f850af1220  ./pytorch_model-00001-of-00007.bin
27b0dc092f99aa2efaf467b2d8026c3f  ./added_tokens.json
2917a1cafb895cf57e746cfd7696bfe5  ./generation_config.json
740c324ae65b1ec25976643cda79e479  ./pytorch_model-00005-of-00007.bin
f7aefb4c63be2ac512fd905b45295235  ./pytorch_model-00004-of-00007.bin
eeec4125e9c7560836b4873b6f8e3025  ./tokenizer.model
369df2f0e38bda0d9629a12a77c10dfc  ./pytorch_model-00006-of-00007.bin
cc9dbf56b68b68a585cc7367696e06a7  ./config.json
76d47e4f51a8df1d703c6f594981fcab  ./pytorch_model.bin.index.json
fd9452959d711be29ccf04a97598e8d1  ./tokenizer_config.json
785905630a0fe583122a8446a5abe287  ./special_tokens_map.json
ae48c4c68e4e171d502dd0896aa19a84  ./pytorch_model-00002-of-00007.bin

如果是这样，您已经成功解码了权重，并且应该能够将该模型与HuggingFace变压器一起使用。如果您的校验和与上述校验和不匹配，则存在问题。

配置

llama-30b-sft-6:
  dtype: fp16
  log_dir: "llama_log_30b"
  learning_rate: 1e-5
  model_name: /home/ubuntu/Open-Assistant/model/model_training/.saved/llama-30b-super-pretrain/checkpoint-3500
  output_dir: llama_model_30b
  deepspeed_config: configs/zero3_config_sft.json
  weight_decay: 0.0
  residual_dropout: 0.0
  max_length: 2048
  use_flash_attention: true
  warmup_steps: 20
  gradient_checkpointing: true
  gradient_accumulation_steps: 16
  per_device_train_batch_size: 2
  per_device_eval_batch_size: 3
  eval_steps: 101
  save_steps: 292
  num_train_epochs: 8
  save_total_limit: 3
  use_custom_sampler: true
  sort_by_length: false
  save_strategy: steps
  datasets:
    - oasst_export:
        lang: "bg,ca,cs,da,de,en,es,fr,hr,hu,it,nl,pl,pt,ro,ru,sl,sr,sv,uk"
        input_file_path: 2023-04-12_oasst_release_ready_synth.jsonl.gz
        val_split: 0.05
    - vicuna:
        val_split: 0.05
        max_val_set: 800
        fraction: 0.8
    - dolly15k:
        val_split: 0.05
        max_val_set: 300
    - grade_school_math_instructions:
        val_split: 0.05
    - code_alpaca:
        val_split: 0.05
        max_val_set: 250

OASST 数据集论文：https://arxiv.org/abs/2304.07327

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun246079.html

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

文心一言APP，官方下载地址

上一篇 2023年4月25日

苹果员工：Siri 改进缓慢、无法追上 ChatGPT 令人沮丧

下一篇 2023年4月28日

工具软件

Microsoft、谷歌和人工智能巨头在人工智能服务中加强儿童保护措施

为了打击人工智能（AI）技术的潜在滥用，Microsoft和谷歌宣布承诺在其生成式人工智能服务中实施新的儿童安全措施。这些承诺是与致力于打击儿童性虐待的非营利组织 Thorn 和 …

2024年4月25日
工具软件

Microsoft 通过最新的修补程序更新解决了 Exchange Server 问题，并添加了 ECC、HMA 支持

Microsoft 宣布发布修补程序更新，旨在解决在安装 2024 年 3 月安全更新后影响 Exchange 服务器的几个问题。除了修复这些问题之外，2024 年 4 月修补程序…

2024年4月25日
如何自定义有声播放器控件

Audible 有几个设置，可帮助您控制在应用程序上收听有声读物的方式。在播放控件所在的 Audible Player 上，暂停/播放、向前/向后跳过、速度和计时器等默认选项完成了…

2024年4月25日 • 工具软件
如何在WhatsApp聊天中固定和取消固定消息

在聊天中固定消息是 WhatsApp 更重要的功能之一。这是突出显示地址和群聊规则等关键信息的好方法，因此用户只需轻轻一按即可将其定向到它。由于最近的更新，您最多可以在 Whats…

2024年4月25日 • 工具软件
工具软件

Adobe 的 VideoGigaGAN 项目可以将模糊的视频变成高清

Adobe 的人们开发了一种生成式 AI 模型，该模型很快就会让您将视频升级到原始分辨率的八倍。Adobe在最近发表的一篇名为VideoGigaGAN的论文中声称，该模型远远优于过…

2024年4月25日
工具软件

如何通过电子邮件将 Windows 共享发送到 Gmail

Microsoft已经有一段时间了附近的共享和链接共享到其他应用程序等功能，但是通过电子邮件将Windows共享发送到Gmail的功能是新的，将大大改善您的工作流程。尽管还有其他…

2024年4月23日
已解决：帐户图片错误此图片无法保存

帐户头像错误。当您尝试在 Windows 上为用户帐户设置个人资料图片时，屏幕上出现此图片无法保存错误消息，任何人都可能发生此图片。除了基本身份识别外，设置个人资料图片还可以帮助…

2024年4月19日 • 工具软件
工具软件

WhatsApp将很快列出“最近在线”的联系人

像任何公司一样，WhatsApp希望您尽可能多地使用其消息传递应用程序。为此，它正在实施一些功能，以促进用户与其联系人之间的互动。您很快就能看到您的哪些联系人最近在线。 WABet…

2024年4月19日
工具软件

如何在WhatsApp上使用聊天过滤器

当所有对话都集中在一个“聊天”部分下时，找到正确的WhatsApp聊天并不总是那么容易。幸运的是，WhatsApp 现在引入了“聊天过滤器”，可让您在打开 WhatsApp 后立即…

2024年4月18日
在iMovie中导出时出错：修复

尝试在iMovie中编辑假期剪辑，但在导出最终输出时不断出现错误？您会松一口气，因为您不是唯一一个在iMovie中遇到此类问题的人。在iMovie中，编辑素材的导出过程可能会变得棘…

2024年4月17日 • 工具软件
工具软件

Android 上的新“查找我的设备”网络是什么，它如何提供帮助

早在 Google I/O 2023 上宣布，Android 上的新“查找我的设备”网络终于来了。但这不仅仅是对当前“查找我的设备”服务的简单更新;这是一个升级，实际上可以让你找到…

2024年4月11日
已解决：跨设备体验主机未安装

Microsoft 在将您的手机作为 PC 上的网络摄像头与跨设备体验主机连接方面做得很好，但它未安装可能不在您的宾果卡上。跨设备体验主机未安装或停滞在挂起状态可能只是安装故障。…

2024年4月8日 • 工具软件
VirtualBox 无法覆盖机器文件夹：修复

在 VirtualBox 中设置虚拟机是一个简单的过程。但是，即使在执行此操作时，它也会在设置屏幕上抛出此错误消息“无法覆盖计算机文件夹”。由于已经存在计算机文件夹，会弹出此问题。…

2024年4月8日 • 工具软件
Outlook在尝试打印时没有响应：修复

一些用户求助于社区，因为每当他们尝试打印电子邮件或附件时，Outlook 似乎都会冻结。现在，应用程序有时会卡顿并不罕见。但是，如果每次尝试打印时Outlook都显示突然崩溃的迹象…

2024年4月8日 • 工具软件
音板未显示在 Discord 上：如何修复

使用 Soundboard 可以增强您在 Discord 服务器中的游戏体验。但是，如果您的每个朋友都可以使用它，那么除了您之外，没有音板可能会令人沮丧。但是，别担心。我们已经详细…

2024年4月7日 • 工具软件
工具软件

OpenAI 让您无需注册即可使用 ChatGPT

OpenAI 正在消除使用 ChatGPT 的所有障碍，甚至不需要注册。该公司周一宣布，它允许用户无需注册即可开始使用聊天机器人。这里的目的是“让任何对人工智能能力感到好奇的人都能…

2024年4月6日
Opera 成为第一个集成本地 AI 模型的主要浏览器

Opera 正在将对 150 种本地 LLM（大型语言模型）变体的支持集成到 Opera One（该公司的 AI 集成浏览器）的开发人员流中。添加对 AI 的实验性本地支持是浏览器…

2024年4月6日 • 工具软件
如何在 Opera One Developer 上启用和使用本地 AI 模型

Opera 最近宣布将本地 AI 模型集成到其 Opera One 浏览器中。随着这一发展，Opera 成为第一个内置 AI 模型的主要浏览器，您现在可以从 150 个大型语言模型…

2024年4月6日 • 工具软件
如何在 Kindle 上调整睡眠定时器

厌倦了每次从快速阅读休息回来时唤醒 Kindle？多亏了更新，您现在可以简单地调整 Kindle 在关闭屏幕之前的等待时间。这个“睡眠定时器”是一种新的 Kindle 设置，让用户…

2024年4月6日 • 工具软件
Stock Gallery 应用程序在 OnePlus、小米、Oppo 和 Realme 手机上集成了 Google 相册

大多数 Android 手机都有两个图库应用程序——一个由 OEM 预装，另一个由 Google 相册安装。但是由于最近的更新，用户将能够将Google相册集成到其OEM的图库应用…

2024年4月6日 • 工具软件
工具软件

WhatsApp将获得基于文本的状态更新的新界面以及转发和快退视频的能力

WhatsApp 通过定期更新不断改进。最近的报道表明，WhatsApp正在开发一个新的状态更新界面，为基于文本的更新提供自己的空间。此外，WhatsApp 还改进了平台上的视频播…

2024年4月6日
Android 15 可能会拒绝安装为 Android 6.0 Marshmallow 构建的应用程序

Android 15 已经凭借我们在开发者预览版上看到的功能成为新闻。现在，有报道称 Android 15 还将提高可安装应用程序的标准。在 Android 14 之前，可以毫无…

工具软件 2024年4月6日
如何从 Android 上的照片创建 WhatsApp 贴纸

\ WhatsApp 贴纸自首次推出以来一直风靡一时。但是，人们永远无法拥有足够的好东西，这就是为什么WhatsApp现在允许您从图库或聊天中的任何图像创建自己独特的贴纸。以下是在…

2024年4月6日 • 工具软件
WhatsApp 将很快允许群组成员创建和管理群组活动

WhatsApp 开发其群组活动功能已经有一段时间了。从表面上看，它将允许群组成员创建事件、在群组中安排视频和音频通话、响应事件并获得提醒。这是一项重大更新，将使团体和社区能够轻松…

2024年4月6日 • 工具软件
工具软件

如何控制 Instagram 上的政治内容过滤器

在世界一半人口投票的一年里，政治内容几乎不容忽视。但Instagram希望让你更好地控制是否在平台上向你推荐政治内容。如果您已经关注了与政治相关的帐户，Instagram 不会妨碍…

2024年4月6日

开放助手 LLaMa 30B SFT 6

开放助手 LLaMa 30B SFT 6

过程

配置

相关推荐