CodeFuse 基于蚂蚁基础大模型研发

2023年9月8日下午8:06 • 工具软件

CodeFuse 基于蚂蚁基础大模型研发，在近期代码补全的 HumanEval 评测中，CodeFuse 得分 74.4%，超过 GPT-4（67%）的成绩，也超过了 WizardCoder-34B 73.2% 的得分。本次开源内容包括代码框架、模型等，现已上架相关平台，可在 HuggingFace 下载模型。

代码框架部分包括自研的多任务微调（Multi-task fine-tuning，缩写为 MFT）框架。MFT 支持代码生成、代码翻译、测试用例生成、bug 修复等数 10 个任务一起微调。MFT 微调框架支持蚂蚁自研模型，以及多个开源大模型的代码能力微调。同时，框架内含创新的微调数据打包技术，号称可提升微调速度约 8 倍；并使用多重部署优化技术，使推理加速约 2 倍。

模型部分包括 CodeFuse13B-4K、CodeFuse-CodeLlaMa34B-MFT 两个大模型。模型训练过程中，CodeFuse 使用了程序分析校验技术，对高质量代码数据进行筛选，并构建了代码领域专用字典，编码平均长度低 10%+。

CodeFuse 早在今年 6 月就开始内测，用以真实开发环境，可以助力开发者低门槛编程，例如用自然语言编写 H5 小游戏、快速开发支付宝小程序等。基于 CodeFuse 的应用场景有开发助手、IDE 插件、数据分析器等，覆盖了目前研发工作的主要需求，在蚂蚁集团内部研发流程中陆续得到验证。

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun253100.html

CodeFuse 大模型研发数据

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

谷歌搜索庆祝成立25周年

上一篇 2023年9月8日上午9:40

LiveKernelEvent Code 1a8 & 1b8：如何修复这些硬件错误

下一篇 2023年9月8日下午8:09

百度经验

使用二手固态硬盘安全吗？（优点和缺点）

SSD 以其可靠性和效率而闻名，但它们并不便宜。因此，您可能希望购买二手 SSD 卡以满足您的存储需求。凭借更快的写入速度和快速的启动时间，人们选择 SSD 而不是 HDD 是理…

2024年4月8日
工具软件

使用 Pretzel AI 轻松进行 Excel 数据分析

使用 Pretzel AI 轻松进行 Excel 数据分析如果您希望利用人工智能来帮助您轻松分析 Microsoft Excel 中的数据，您可能会对 Pretzel AI 感兴…

2024年3月28日
工具软件

什么是 TensorFlow，为什么它很重要？

什么是 TensorFlow，为什么它很重要？ TensorFlow 是一个可通过 GitHub 访问的开源机器学习和 AI 开发平台，兼容 Python、JavaScript、J…

2024年3月26日
工具软件

什么是 TensorFlow，为什么它很重要？

什么是 TensorFlow，为什么它很重要？ TensorFlow 是一个可通过 GitHub 访问的开源机器学习和 AI 开发平台，兼容 Python、JavaScript、J…

2024年3月24日
工具软件

如何在没有互联网连接的情况下私下运行人工智能

如何在没有互联网连接的情况下私下运行人工智能如果您正在寻找一种方式，在您自己的本地计算机或家庭网络上享受触手可及的人工智能（AI）的力量，而不必担心损害您的隐私。您现在可以在…

2024年3月15日
将数据从Android传输到iPhone的9种方法

如果您现在正在阅读本文，那么您可能正在抛弃旧的 Android 设备，转而使用全新的 iPhone。尽管 iPhone 易于交互，但在从 Android 切换到 iPhone 之前…

2024年2月4日 • 工具软件
将数据从iPhone传输到Android的11种方法

所以你抛弃了你的旧iPhone，给自己买了一部全新的Android手机。虽然使用 Android 设备非常简单，但如果您在 iPhone 和 Apple 生态系统上使用多年后仍在使…

2024年2月3日 • 苹果Apple
避免无法访问 Gmail 数据的 6 种方法

，Google 不会像更简单的情况下那样收到提示，而是通过短信/电话发送一个 6 位数的代码，您必须输入该代码才能安全登录 Gmail 或任何其他 Google 服务。您可以向自己…

2024年1月12日 • 工具软件
工具软件

如何将数据传输到新iPhone

将数据传输到新 iPhone 通常看起来是一项艰巨的任务，但不要担心！无论您是升级到最新型号还是只是第一次切换到 iPhone，都有几种方法可以确保平稳过渡。关键是选择最适合您当前…

2024年1月3日
工具软件

人工智能（AI）将在 2024 年发展的 4 个领域

2023 年，人工智能（AI）出现了巨大的爆炸式增长，OpenAI、Microsoft、Google 等公司发布了丰富的 AI 模型和服务，为我们将利用 AI 力量的新未来铺平…

2024年1月2日
工具软件

如何使用 ChatGPT 计划、起草和撰写研究文章

在学术研究领域，撰写一篇写得好的文章与研究本身一样重要。这项任务不仅涉及数据和数字的呈现，还涉及将这些元素编织成既丰富又引人入胜的叙述的能力。这就是 OpenAI 的 ChatGP…

2024年1月2日
工具软件

如何使用ChatGPT进行数据分析

在数据分析领域，简单性和效率是关键，特别是对于那些可能不熟悉编程或电子表格软件（如 Excel）复杂性的人来说。这就是数据分析创新工具ChatGPT发挥作用的地方。如果您是小企业主…

2023年12月29日
工具软件

如何微调 Mixtral 8x7B Mistral Ai Mixture of Experts （MoE） AI 模型

当谈到增强 Mixtral 8x7B 的功能时，Mixtral 8x7B 是一种拥有惊人的 870 亿个参数的人工智能模型，这项任务似乎令人生畏。该模型属于专家混合（MoE）类…

2023年12月26日
苹果Apple

如何将数据传输到新iPhone

升级到新 iPhone 是一个激动人心的时刻，但它通常伴随着传输数据的挑战。无论您是经验丰富的 iPhone 用户还是生态系统的新手，本指南都将引导您无缝完成整个过程。如果您想知道…

2023年12月25日
苹果Apple

如何设置您的新iPhone

如果您在圣诞节收到了一部新iPhone，那么您可能想知道如何设置设备，本指南旨在涵盖有关如何设置它的所有内容。当您使用新 iPhone 开始您的冒险时，让我们成为您顺利直接的设置过…

2023年12月25日
iOS 17.2：如何使用 Siri 访问和写入健康数据

在 iOS 17.2 中，Siri 可以从“健康” App 访问数据，这意味着你可以让 Siri 读取“健康” App 中提供的健康信息或写入某些信息。继续阅读以了解其工作原理。 …

2023年12月19日 • 苹果Apple
工具软件

Dropbox 是否将用户数据发送到 OpenAI？有一个选择退出！

Dropbox 陷入了争议，此前用户发现一项实验性 AI 功能一直在向 OpenAI 发送用户数据。默认情况下，该选项为云存储服务的高级用户启用。自从 OpenAI 的ChatG…

2023年12月17日
工具软件

大型语言模型的最佳大小是多少

当涉足语言模型的世界时，人们很容易认为模型越大，它的性能就越好。这个概念植根于这样一种信念，即更多的数据和更多的参数意味着模型可以做更多的事情。但现实并非如此简单。语言模型的理想大…

2023年12月15日
工具软件

使用 Duet AI 将反应式仪表板升级为主动式仪表板

在商业中，提前发现潜在问题对于保持高生产力和运营效率至关重要。对于那些在制造业中管理数据的人来说，挑战在于将传统的被动方法转变为主动策略。这就是 Duet AI、Looker 和 …

2023年12月15日
工具软件

Anytype 与 Notion 安全比较分散式与集中式

在不断发展的数字时代，我们在线工作空间的安全性至关重要。Anytype和Notion是数字组织和生产力领域的两家巨头，它们提供了独特的数据安全方法。您会很高兴地知道，这两个平台的安…

2023年12月14日
最新资讯

Dropbox 是否将用户数据发送到 OpenAI？有一个选择退出

Dropbox 陷入了争议，此前用户发现一项实验性 AI 功能一直在向 OpenAI 发送用户数据。默认情况下，该选项为云存储服务的高级用户启用。自从 OpenAI 的ChatG…

2023年12月14日
苹果Apple

用于访问“健康”App 数据和记录体能训练的 Apple Siri 命令

由于苹果公司发布了Siri个人助理的新更新，用户现在可以使用语音命令轻松访问健康应用程序数据并记录锻炼。随着 watchOS 10.2、iOS 17.2 和 iPadOS 17.2…

2023年12月12日
工具软件

AI 初学者指南中的知识图谱 – 它们是什么以及如何制作一个

在人工智能（AI）领域，知识图谱是一项至关重要的创新，在机器学习和自然语言处理（NLP）等领域尤为重要。这些结构作为复杂的地图，说明了不同数据元素之间的复杂关系，从而使人工…

2023年12月8日
工具软件

将 AI 大型语言模型 LLM 与知识图谱集成

在激动人心的人工智能（AI）世界中，两项杰出的技术正在掀起波澜：GPT-3 等大型语言模型（LLM）和知识图谱。这些工具正在改变我们处理和分析数据的方式，从而实现更明智的决…

2023年12月5日
工具软件

ChatGPT 被黑客入侵以显示个人详细信息和训练数据

研究人员已经找到了一种方法，可以从 ChatGPT 等 GPT 的记忆中提取超过一百万条信息。使用相当简单的提示，他们已经证明，从ChatGPT和其他类似的大型语言模型等人工智能系…

2023年12月5日

CodeFuse 基于蚂蚁基础大模型研发

相关推荐