AI 是如何工作的

AI 是如何工作的

Nir Zicherman在他的文章中,用非技术性的语言解释了大型语言模型(LLMs)的工作原理,他采用了烹饪和菜单规划的类比来简化这些概念。Zicherman擅长将复杂的技术概念深入浅出地解释给非技术受众,他将这一过程分为两个主要步骤:构建食物模型和发现模式。

在“构建食物模型”的步骤中,目标是教会计算机如何将食物作为数据来处理,而不依赖于口味或食物搭配等定性细节。这一过程通过向计算机输入大量关于过去菜肴搭配的数据来完成,使计算机能够根据菜肴之间的共现频率对它们进行分类。这样就形成了一个“菜肴空间”,在这个空间里,根据共现模式,相似的菜肴被归为一组,而不同的菜肴则相隔较远。

第二步“发现模式”则涉及训练模型预测哪种菜肴最能补充一套特定的菜肴组合。模型依据其从数据中学习到的模式,使用这个“菜肴空间”来确定最适合完成一顿餐的菜肴类型。

将这个比喻应用到LLMs上,Zicherman建议把食物换成句子,把菜肴换成单词。训练过程包括理解单词之间基于上下文的关系,以及发现用于预测句子中下一个最可能出现的单词的模式。这实际上是文本AI工具的基本操作——“下一个单词预测”。

文章强调,尽管AI具有变革性潜力,但其基础原理并不复杂。它涉及简单的数学概念、大量的训练数据,以及找出数据中的模式以模拟机器的“思维”过程。Zicherman在文章最后指出,只要正确解释,AI技术其实是易于理解和简单的,这意味着它并不像许多人所想的那样难以接近。

原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun280760.html

(0)
打赏 微信扫一扫不于多少! 微信扫一扫不于多少! 支付宝扫一扫礼轻情意重 支付宝扫一扫礼轻情意重
上一篇 2024年2月6日
下一篇 2024年2月6日

相关推荐