Llemma: 数学 LLM

Llemma: 数学 LLM

开源 LLM,用于在最多 200B 个数学文本标记上进行训练的数学LLM。Llemma 34B 的性能接近 Google 的 Minerva 62B,尽管其参数只有一半。使用Proof-Pile-2,一种混合科学论文、包含数学内容的网络数据和数学代码,从而产生Llemma。在MATH基准测试中,Llemma在等参数基础上优于所有已知的开放基模型,以及未发布的Minerva模型套件。此外,Llemma能够在无需进一步微调的情况下进行工具使用和形式定理证明。

原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun262290.html

(0)
打赏 微信扫一扫不于多少! 微信扫一扫不于多少! 支付宝扫一扫礼轻情意重 支付宝扫一扫礼轻情意重
上一篇 2023年10月23日
下一篇 2023年10月24日

相关推荐