MLC LLM带来轻松的语言模型部署

2023年5月8日下午10:50 • 最新资讯

MLC LLM是一个新的开源项目，旨在支持在各种硬件平台和应用程序上部署大型语言模型。该项目包括一个框架，用于优化每个特定用例的模型性能，其任务是允许任何人在其设备上本地开发，优化和部署AI模型，而无需依赖服务器支持。本文将深入探讨MLC LLM及其功能。

MLC LLM的核心是一种称为机器学习编译（MLC）的技术。MLC 结合了机器学习编程抽象、学习驱动的搜索、编译和优化的库运行时，以便于部署。该方法旨在优化每个特定用例的模型性能，这在跨各种硬件平台部署大型语言模型时至关重要。

支持异构硬件规范

在各种硬件平台和应用程序上部署大型语言模型是一项复杂的挑战，这就是MLC LLM的亮点。该项目面临着支持异构硬件规范的挑战，包括不同型号的CPU、GPU和其他协处理器和加速器，以及解决内存限制和处理操作系统环境变化的挑战。

利用现有的开源项目

为了实现其目标，MLC LLM基于Apache TVM Unity，这是一个用于深度学习系统的编译器堆栈，并利用了Hugging Face和Google的令牌化器，以及开源LLM，如Llama，Vicuna，Dolly等。该项目包括一个C++ CLI 工具和一个 iOS 聊天应用程序，展示了如何集成已编译的工件和所需的预/后处理。

MLC LLM可以部署在各种硬件上，包括最近的Apple Silicon，AMD 显卡s,英伟达显卡s，以及英特尔 UHD 显卡 630 GPU。不同支持硬件的性能差异很大，一些 NVIDIA GPU、AMD RX6800 16G VRAM 和 2021 款 MacBook Pro M1 Max 的得分超过 20 个代币/秒。相比之下，M1 iPad Pro达到10.6个代币/秒，iPhone 14 Pro达到7.2个代币/秒。

根据项目维护者的说法，MLC LLM可以运行快速实验并尝试编译器优化，并最终轻松部署到所需的目标。该项目有一个专注于Web浏览器的配套项目WebLLM。如果您有兴趣了解有关 MLC 的更多信息，可以查看官方文档，该文档将指导您完成用于表示机器学习程序的关键抽象、自动优化技术以及如何优化依赖项、内存和性能。

退房MLC LLM的GitHub页面在这里.

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun227264.html

MLC 机器学习

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

如何在Mac上右键单击：综合教程

上一篇 2023年5月6日下午7:53

ChatGPT将很快可以访问互联网

下一篇 2023年5月8日

工具软件

什么是 TensorFlow，为什么它很重要？

什么是 TensorFlow，为什么它很重要？ TensorFlow 是一个可通过 GitHub 访问的开源机器学习和 AI 开发平台，兼容 Python、JavaScript、J…

2024年3月26日
工具软件

什么是 TensorFlow，为什么它很重要？

什么是 TensorFlow，为什么它很重要？ TensorFlow 是一个可通过 GitHub 访问的开源机器学习和 AI 开发平台，兼容 Python、JavaScript、J…

2024年3月24日
工具软件

Google 将 Colab 代码辅助功能扩展到所有用户，包括免费计划

谷歌最近增强了其机器学习平台 Colab，向所有用户（包括免费计划的用户）引入了人工智能驱动的代码帮助。这一重大更新有望使对高级机器学习工具的访问民主化，从而有可能改变更广泛的受众…

2023年12月21日
工具软件

PyTorch 与 TensorFlow 机器学习框架比较

在动态的机器学习世界中，两个重量级框架通常主导着对话：PyTorch 和 TensorFlow。这些框架不仅仅是创建复杂算法的一种手段;它们构成了当今人工智能的基石。本 PyTor…

2023年11月6日
工具软件

什么是 Vertex AI by Google 机器学习（ML）平台？

Vertex AI 是 Google Cloud 推出的一个全面的机器学习平台，为机器学习模型和 AI 应用程序的创建、部署和定制提供了一套包罗万象的工具和资源。该平台融合了数据工…

2023年11月4日
工具软件

什么是 PyTorch 机器和深度学习框架？

PyTorch是一个机器学习和深度学习框架，已经成为研究人员和开发人员的强大工具。它提供了速度、灵活性和用户友好界面的独特组合，使其成为各种项目的理想选择。本文深入探讨了 PyTo…

2023年10月12日
工具软件

什么是Hugging Face，为什么它很重要？

在人工智能（AI）和机器学习（ML）的动态世界中，有一个平台以其稳健性、灵活性和社区驱动的精神而脱颖而出。进入Hugging Face，这是一个开源数据科学和机器学习中心，…

2023年8月31日
工具软件

MLC Chat苹果版IOS下载，手机上使用AI

独立的 MLC Chat App 目前已经上架苹果 App Store。感兴趣的小伙伴们可以下载进行尝试。与在您的设备上运行的开放式语言模型进行离线、本地聊天。MLC Chat允…

2023年6月5日
工具软件

苹果收购人工智能公司WaveOne

Apple 收购了一家人工智能领域的公司。报导指出，Apple 「低调地」收购了位于Mountain View 的公司WaveOne，该初创公司正在「开发用于压缩视频的AI 算法」…

2023年3月28日
ERNIE Bot 文心一言是什么，有什么特长

点击进入：ChatGPT工具插件导航大全 ERNIE Bot（Enhanced Representation through kNowledge IntEgration）是百度开发…

工具软件 2023年3月17日
工具软件

最佳 AI 内容检测工具：免费 ChatGPT3 输出检测器

点击进入：ChatGPT工具插件导航大全 AI 内容检测工具是分析和扫描文本以确定它们是人工编写还是机器编写的好方法。此工具有助于检查内容的原创性并防止您的内容被谷歌垃圾邮件。但是…

2023年2月18日
最新资讯

AirSim 项目无需深度机器学习和编码专业知识即可训练自动驾驶飞机

Project AirSim 中的真实环境将允许 AIR 模型在几秒钟内体验数百万次飞行，并学习如何对物理世界的不同变量做出反应，包括雨、雨夹雪、雪、强风、高温、阴天等。微软于 …

2022年7月20日
新的 Teams 功能使用 AI 和机器学习来改善视频和音频体验

点击进入：ChatGPT工具插件导航大全 6 月 13 日，微软为其通信平台 Teams发布了众多新功能，重点提升了语音和视频质量。特别是，这些新的 Teams 功能包括回声消除、…

微软Microsoft 2022年6月15日
谷歌Google

谷歌浏览器即将使用机器学习调整地址栏图标

谷歌透露计划在公司的 Chrome 网络浏览器中增加机器学习的使用，使其成为“更有用的浏览器”。例如，谷歌已经在 Chrome 中使用机器学习来提高可访问性。该公司计划在未来将机…

2022年6月12日
苹果Apple

iOS 16 可让您隔离、复制和共享照片中的主题

使用先进的机器学习，iOS 16将允许用户从照片中提取主题，然后将该主题作为照片拖放到整个系统中，以便在消息、便笺、邮件等中使用。该功能不仅适用于照片，甚至适用于屏幕截图和快速查…

2022年6月8日
苹果Apple

Apple 发布 Final Cut Pro 10.6.2，具有重复检测、语音隔离和优化的 Mac Studio 性能

Apple 发布了最新版本的 Final Cut Pro，版本 10.6.2。FCP 更新包括两个主要的新功能——重复检测和语音隔离。重复检测是一项功能，对于那些编辑长篇内容和纪录…

2022年4月13日
AMD ROCm 5.0.2 发布，带有修复、次要文档更新

ROCm 5.0 发布正式支持 RDNA2，周五晚上标志着该开源 AMD Radeon Open eCosystem 计算堆栈更新的最新发布。与最近的ROCm 5.0.1一样，R…

最新资讯 2022年3月6日
微软Microsoft

Microsoft宣布启用Azure Arc的机器学习的预览

Windows 11 Pro ISO文件在哪下载最新版？如何下载原装纯净版Win11 ?点击进入持续更新! Microsoft宣布了两个新的与Azure Arc相关的更新。 …

2021年3月3日
苹果Apple

音乐流媒体服务支付4.24亿美元的许可费，其中1.63亿美元来自苹果

机械许可集体（MLC）宣布，它已从所有音乐流媒体服务（包括Apple Music，Spotify和Amazon Music ）获得总计424,384,787美元的许可费。苹果公司负…

2021年2月18日

MLC LLM带来轻松的语言模型部署

支持异构硬件规范

利用现有的开源项目

相关推荐