马斯克发布AI模型Grok的最详细介绍

2023年11月6日下午7:03 • 工具软件

Grok 简介

鉴于马斯克强烈的星际殖民和科幻爱好，他将Grok定位为一款模仿《银河系漫游指南》的人工智能，几乎可以回答任何问题，它也会向你提建议帮你决定你要问什么问题。

Grok 的设计目的是用一点智慧来回答问题，并且具有叛逆性。比如问他一些可能有害的问题的时候它不但会拒绝回答还会嘲讽你。

Grok 的一个独特且基本的优势是它可以通过𝕏（Twitter）平台实时了解世界。它还可以回答大多数其他人工智能系统拒绝的尖锐问题。

Grok目前还是一个早期测试产品，他会在准备好之后优先向美国的X平台的Premium Plus用户提供。

https://u.jd.com/pqxr8rX

Grok 的目标和愿景

xAI希望创建能够帮助人类追求理解和知识的人工智能工具。所以Grok的目标是：

收集反馈并确保他们正在构建最大程度地惠益全人类的人工智能工具。他们认为设计对所有背景和政治观点的人都有用的人工智能工具非常重要。他们还希望根据法律赋予用户使用我们的人工智能工具的权力。
赋予研究和创新能力：他们希望Grok能成为任何人的强大研究助手，帮助用户快速获取相关信息、处理数据并提出新的想法。

Grok 的应用层功能

xAI的一个团队成员发布了一些Grok聊天助手应用层面的一些信息。在模型内容之外Grok应用层面也充满了马斯克做事的风格。

首先Grok允许同时处理多项任务。可以运行多个并发对话，并在对话进行时在它们之间进行切换。

可以对对话进行分支，以便更好地了解 Grok 的回复。回复树允许在各个分支之间来回切换。此外，还有 / 命令可减少点击次数。

可以在 VS 代码编辑器中打开所有生成的代码片段。

可以在 Markdown 编辑器中打开 Grok 的回复，保存它，然后继续对话。这与上面展示的分支和分支树协同工作（ChatGPT输入的时候连换行都困难，体验太差了）。

同时在 Grok 图标上有个彩蛋可以切换为幽默模式。

Grok 模型的基本信息

在宣布xAI之后，他们训练了一个拥有33B参数的原型LLM（Grok-0）。这个早期模型在标准的语言模型基准测试中接近LLaMA 2（70B）的能力，但只使用了一半的训练资源。

在过去的两个月中，他们在推理和编码能力方面取得了显著的改进，最终开发出了Grok-1，这是一款先进的语言模型，具有更强大的性能，人工评估编码任务得分达到63.2%，MMLU得分达到73%。

在这些基准测试中，Grok-1展现出了强大的结果，超过了其所属计算级别中的所有其他模型，包括ChatGPT-3.5和Inflection-1。它只被那些使用了大量训练数据和计算资源进行训练的模型所超越，比如GPT-4。

由于这些基准测试可以在网络上找到，他们不能排除我们的模型无意中是在这些基准测试上进行训练的，因此他们对模型（以及Claude-2和GPT-4）在2023年5月底发布的匈牙利国家高中数学期末考试中进行了手动评分，这是在我们收集数据集之后发布的。Grok以C（59％）的成绩通过了考试，而Claude-2获得了相同的成绩（55％），GPT-4以68％的成绩获得了B。

所有模型都在温度为0.1且相同的提示下进行评估。必须注意的是，他们没有为此评估进行任何调整。这个实验作为对我们的模型从未明确调整过的数据集进行的“现实生活”测试。

从上面这段描述来看老马的团队还是要脸的，比国内一些用测试题训练做开卷考试，完事还厚颜无耻的说超过GPT-4的强很多。

同时根据模型卡的介绍初始的Grok-1具有8,192个Token的上下文长度，Grok-1发布版本所使用的训练数据来自互联网截至2023年第三季度的数据以及我们的AI导师提供的数据。

xAI所使用的工程技术

为了创建Grok，xAI基于Kubernetes、Rust和JAX构建了一个定制的训练和推理框架。

GPU的故障方式多种多样：制造缺陷、松动的连接、配置错误、降级的内存芯片、偶发的随机位翻转等等。在训练过程中，需要在数万个GPU之间进行计算同步，而由于规模的扩大，所有这些故障模式都变得更加频繁。

为了克服这些挑战，xAI采用了一套自定义的分布式系统，确保每一种故障都能立即被识别并自动处理。在xAI将最大化每瓦有用计算作为努力的重点。

在过去几个月中，xAI基础设施使能够将停机时间降至最低，并在硬件不可靠的情况下保持高模型浮点运算利用率（MFU）。

Rust已被证明是构建可扩展、可靠和易维护基础设施的理想选择。它提供高性能、丰富的生态系统，并防止了分布式系统中通常会遇到的大多数错误。考虑到我们团队规模较小，基础设施的可靠性至关重要，否则维护将会抑制创新。Rust让我们有信心，任何代码修改或重构都有可能产生可运行数月且需要最少监督的程序。

为了准备下一次模型能力的跃升，需要可靠地协调数万个加速器上的训练运行（数万张卡老马是真的豪啊），运行互联网规模的数据管道，并将新的能力和工具集成到Grok中。

xAI的研究

他们也介绍了一些目前正在关注的研究方向，从排序来看他们将监督学习放在了最前面。

可扩展的工具辅助监督。人类反馈至关重要。然而，在处理冗长的代码或复杂的推理步骤时，提供一致准确的反馈可能具有挑战性。人工智能可以通过查找不同来源的参考资料、使用外部工具验证中间步骤，并在必要时寻求人类反馈来协助可扩展的监督。我们的目标是在我们的模型的帮助下，最有效地利用我们的人工智能导师的时间。
将正式验证与安全性、可靠性和基础结合起来。为了创建能够深入思考现实世界的AI系统，他们计划在较少歧义和更可验证的情况下开发推理能力。这使我们能够在没有人类反馈或与现实世界的互动的情况下评估我们的系统。这种方法的一个主要即时目标是为代码正确性提供正式保证，特别是关于AI安全的可验证方面。
长上下文理解和检索。训练模型以高效地在特定上下文中发现有用的知识是打造真正智能系统的核心。我们正在研究能够在需要时发现和检索信息的方法。
对抗性鲁棒性。对抗性示例表明，优化器可以轻易地利用人工智能系统的漏洞，无论是在训练还是服务期间，从而导致系统犯下严重错误。这些漏洞是深度学习模型长期存在的弱点。我们特别关注提高LLMs、奖励模型和监控系统的鲁棒性。
多模态能力。目前，Grok没有其他感官，比如视觉和听觉。为了更好地帮助用户，我们将为Grok配备这些不同的感官，以实现更广泛的应用，包括实时互动和协助。

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun264577.html

Grok 人工智能模型

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

xAI的研究什么的

上一篇 2023年11月6日

Midjourney训练模型？风格微调功能详细用法

下一篇 2023年11月6日

如何在Windows本地运行Microsoft Phi-3 AI

Microsoft 的 Phi-3 系列语言模型终于来了。就它们的尺寸而言，它们绝对是一个级别的差异，并且已经证明在许多方面比其他最近发布的型号（如 Llama 3 和 Mistr…

2024年4月29日 • Win 11
工具软件

Microsoft、谷歌和人工智能巨头在人工智能服务中加强儿童保护措施

为了打击人工智能（AI）技术的潜在滥用，Microsoft和谷歌宣布承诺在其生成式人工智能服务中实施新的儿童安全措施。这些承诺是与致力于打击儿童性虐待的非营利组织 Thorn 和 …

2024年4月25日
如何在 Opera One Developer 上启用和使用本地 AI 模型

Opera 最近宣布将本地 AI 模型集成到其 Opera One 浏览器中。随着这一发展，Opera 成为第一个内置 AI 模型的主要浏览器，您现在可以从 150 个大型语言模型…

2024年4月6日 • 工具软件
谷歌Google

谷歌正在将 SGE AI 摘要扩展到美国的更多用户，即使他们没有注册

美国的一些用户开始在搜索页面顶部获得人工智能生成的查询摘要。新的搜索从顶部结果中提取信息，提供参考链接和图像，并以一口大小的句子总结信息，使用户能够快速获得查询的答案。这可能会让…

2024年4月6日
最新资讯

Threads 在美国推出了一项新的“Trending Now”功能

美国的 Threads 用户已开始在他们的 Feed 中看到一个新的“Trending Now”部分。在这里，用户可以找到热门话题，这些话题正在激发平台上越来越多的对话。Trend…

2024年4月2日
新的人工智能模型可以在有限的人工干预下相互交谈和学习

人工智能系统正在快速发展。发表在《自然》杂志上的一篇新论文强调了人工智能网络的发展，该网络不仅可以仅依靠书面指令来学习和执行任务，还可以教另一个没有此类指令或经验的“姐妹”人工智能…

工具软件 2024年4月2日
工具软件

Mistral AI 创始人 Arthur Mensch 讨论开源 AI

Mistral AI 创始人 Arthur Mensch 讨论开源 AI 在 AI Ascent 大会上，Mistral AI 的创始人 Arthur Mensch 提出了一个令人…

2024年3月29日
工具软件

创建可信赖 AI 模型的 5 个基本原则

创建可信赖 AI 模型的 5 个基本原则随着人工智能（AI）越来越多地渗透到我们的生活中，对这些系统的信任变得至关重要。IBM 概述了五项基本原则，这些原则对于创建 AI 模…

2024年3月29日
微软Microsoft

微软为厂商定义 AI PC：必须配备 Copilot 键

英特尔、微软、高通以及 AMD 等科技巨头，近月来一直在推广所谓的「AI PC」概念。虽然我们仍在等待微软就其Windows中人工智能大计的更多细节进行分享，英特尔已开始公布微软…

2024年3月29日
工具软件

NVIDIA 和 AI 个人计算的未来

NVIDIA 和 AI 个人计算的未来 NVIDIA 应用深度学习研究副总裁 Bryan Catanzaro 和 Imbue 首席执行官 Kanjun Qiu 在最近的一次采访中解…

2024年3月26日
工具软件

Open-Sora 开源替代 OpenAI 的 Sora 文本转视频 AI

Open-Sora 开源替代 OpenAI 的 Sora 文本转视频 AI 继今年早些时候推出 Sora 之后，OpenAI 强大的文本到视频 AI 模型以 Open-Sora 的…

2024年3月26日
工具软件

OpenAI Q Star 理论 AI 模型解读

OpenAI Q Star 理论 AI 模型解读如果您有兴趣了解有关 OpenAI Q* Star AI 模型的更多信息，该模型显然正在开发中。本快速指南概述了我们目前所知道…

2024年3月26日
我该使用哪款 AI？AI 模型的超能力与现状

一年多来，GPT-4 一直是占主导地位的 AI 模型，显然比任何其他可用的 LLM 系统都要聪明得多。这种情况在上个月发生了变化，现在有三个GPT-4级模型，它们都为自己的聊天机器…

2024年3月26日 • 工具软件
DepthFM: 使用深度流匹配技术的快速单目深度预测

DepthFM: 使用深度流匹配技术的快速单目深度预测一个深度图分析模型，通过流匹配（Flow Matching）技术，可以有效地实现这一目标，因为它在解空间中形成的直线轨迹既高…

工具软件 2024年3月26日
VoiceCraft：超过XTTS的语音模型

VoiceCraft：超过XTTS的语音模型 VOICECRAFT模型介绍： VOICECRAFT是一个先进的神经编解码语言模型，专门用于语音编辑和零样本文本到语音（TTS）任务。…

工具软件 2024年3月26日
字节发布了AnimateDiff-Lightning 模型

字节发布了AnimateDiff-Lightning 模型字节发布了AnimateDiff-Lightning 模型，只需要 4-8 步的推理就可以生成质量非常不错的视频。跟 …

工具软件 2024年3月26日
工具软件

Suno 发布了自己的歌曲生成模型V3版本

Suno 发布了自己的歌曲生成模型V3版本 Suno 正式发布了他们的 V3 音乐生成模型，现在所有人都可以使用。 V3 改进的内容主要是： ◦ 音质更佳，带来更加清晰动听的音频体…

2024年3月26日
工具软件

有关 OpenAI Q-STAR 的更多细节揭晓

有关 OpenAI Q-STAR 的更多细节揭晓关于 OpenAI 的 Q-STAR 有一个未经证实的泄漏，这是一个对话系统，据说利用基于能量的模型（EBM）来生成响应。据报…

2024年3月24日
工具软件

如何在没有互联网连接的情况下私下运行人工智能

如何在没有互联网连接的情况下私下运行人工智能如果您正在寻找一种方式，在您自己的本地计算机或家庭网络上享受触手可及的人工智能（AI）的力量，而不必担心损害您的隐私。您现在可以在…

2024年3月15日
工具软件

如何使用 AI 通过日志行集思广益书籍故事情节

如何使用 AI 通过日志行集思广益书籍故事情节如果你想利用人工智能的力量来帮助你集思广益你的下一本书的想法或故事情节，你可能会对一种新的头脑风暴技术感兴趣，这种技术专注于布莱克·…

2024年3月15日
工具软件

GFlowNets是人工智能的未来吗，它们是什么？

GFlowNets是人工智能的未来吗，它们是什么？ GFlowNets 是在 Yoshua Bengio 的指导下开发的，代表了人工智能（AI）领域的一种新颖训练算法，与 Tr…

2024年3月15日
工具软件

Figure01 搭载ChatGPT视觉和语音转语音通信的机器人

Figure01 搭载ChatGPT视觉和语音转语音通信的机器人想象一下，在这个世界里，配备人工智能的人形机器人不仅可以与您交谈，还可以像人一样理解周围的环境并与之互动。Open…

2024年3月15日
工具软件

Stable Diffusion 和 ComfyUI AI 艺术生成器初学者指南

Stable Diffusion 和 ComfyUI AI 艺术生成器初学者指南如果您想开始使用 Stable Diffusion 和 ComfyUI，乍一看非常复杂。您会很高兴…

2024年3月15日
工具软件

OpenAI 首席技术官透露可能的 Sora AI 视频生成器发布日期

OpenAI 首席技术官透露可能的 Sora AI 视频生成器发布日期 OpenAI 首席技术官（CTO） Mira Murati 在接受《华尔街日报》采访时，对 OpenAI …

2024年3月15日
工具软件

我们对 ChatGPT-5 有什么期待？

我们对 ChatGPT-5 有什么期待？伊戈尔·波加尼（Igor Pogany）最近发表了演讲，重点介绍了ChatGPT-5等语言模型未来迭代的预期进步和能力，以及个人和企业准备…

2024年3月15日