bot.gif
close
正在加载
小语言模型(SLM)将成为人工智能的下一个大事件
Enacy Mapakame • 2小时前
摘要
虽然公司正在向LLM投入大量资金,但人工智能领域的一些行业专家认为,小型语言模型(SLM)将成为下一个大事件。

虽然公司正在向大型语言模型(LLM)投入大量资金,但人工智能领域的一些行业专家认为,小型语言模型(SLM)将成为下一个大事件。

这是因为随着节日的到来,该行业的活动继续增长,科技公司投入了更多的资金来开发他们的技术。

未来在小型语言模型中

亿万富翁埃隆·马斯克(Elon Musk)经营的xAI等公司设法从安德森·霍洛维茨基金(Andreessen Horowitz)、卡塔尔投资局(Qatar Investment Authority)、红杉资本(Sequoia)和Valor Equity Partners筹集了额外的50亿美元,而亚马逊(Amazon)则向竞争对手Anthropic额外投资了40亿美元OpenAI.

虽然这些大型科技公司和其他公司正在投资数十亿美元,专注于开发大型LLM来处理许多不同的任务,但人工智能的现实是,没有一刀切的方法,因为企业需要针对特定任务的模型。

AWS首席执行官Matt Garman在一份关于他们不断扩大的合作伙伴关系和投资的新闻稿中表示,正在开发由Anthropic支持的生成式人工智能的AWS客户已经做出了压倒性的回应。

对于大多数公司来说,LLM仍然是某些项目的首选,但对于其他公司来说,这种选择在成本、能源和计算资源方面可能很昂贵。

Teradata总裁兼首席执行官Steven McMillan提供了替代路径对于一些企业也有其他看法。他对SLM的未来充满信心。

“展望未来,我们认为中小型语言模型和受控环境(如特定领域的LLM)将提供更好的解决方案。”

~麦克米兰

SLM生产定制输出在特定类型的数据上,语言模型经过专门训练。由于SLM生成的数据保存在内部,因此语言模型是在潜在的敏感数据上进行训练的。

由于LLM是耗能的,因此小型语言版本经过训练,可以根据项目的实际需求扩展计算和能源使用。通过这样的调整,这意味着SLM的效率比目前的大型型号低。

对于希望将AI用于特定知识的用户,可以选择特定领域LLMs因为它们不提供广泛的知识。它被训练成只深入理解一类信息,并在该领域做出更准确的回应,例如CMO与CFO。

为什么SLM是首选

根据数据科学家协会(ADaSci)的数据,为100万用户完全开发一个具有70亿个参数的SLM只需要55.1MWh(兆瓦时)。

ADaSci发现培训GPT-31750亿个参数消耗了约1287MWh的电力,这还不包括正式投入公众使用的时间。因此,SLM大约消耗了LLM训练所消耗能量的5%。

大型模型通常在云计算机上运行,因为它们使用的计算能力比单个设备上可用的计算能力更强。这给公司带来了复杂性,因为当信息转移到云端时,他们失去了对信息的控制,并且在互联网上传播时响应缓慢。

展望未来,企业采用人工智能不会是一刀切的,因为效率和选择最好、最便宜的工具来完成任务将是重点,这意味着为每个项目选择合适的模型。

这将适用于所有模型,无论是通用LLM,还是更小、特定于领域的LLM,具体取决于哪种模型将提供更好的结果,需要更少的资源,并减少数据迁移到.

在下一阶段,人工智能将对商业决策至关重要,因为公众对人工智能生成的答案有很高的信心。

“当你想到训练人工智能模型时,它们必须建立在大数据的基础上。”

~麦克米兰

麦克米兰补充道:“这就是我们所要做的,提供可信的数据集,然后提供功能和分析能力,这样客户及其客户就可以信任这些输出。”。

随着世界对效率和准确性的要求越来越高,小型和特定领域的LLM为公司和更广泛的公众提供了另一种交付结果的选择。

循序渐进的系统在90天内启动您的Web3职业生涯并获得高薪加密货币工作。

发表评论
暂无评论
    查看更多评论

    免责申明:

    本网站所提供的所有信息仅供参考,不构成任何投资建议。用户在使用本网站的信息时应自行判断和承担风险。币界网不对用户因使用本网站信息而导致的任何损失负责。用户在进行任何投资活动前应自行进行调查和研究,并谨慎决策。币界网不对用户基于本网站信息做出的任何投资决策负责。用户在本网站发布的任何内容均由其个人负责,与币界网无关。