想知道从哪里开始使用小型语言模型?找出小型语言模型比大型语言模型更好的顶级用例。想知道从哪里开始使用小型语言模型?找出小型语言模型比大型语言模型更好的顶级用例。

何时使用小型语言模型而非大型语言模型

2025/12/15 02:21

大型语言模型(LLMs)继续在效率与信任之间走钢丝。用户认为它有效,但怀疑其准确性

对某些用例而言,它也可能是过度使用。例如,考虑到其高计算成本,使用LLMs可能不是所有内部人力资源任务的最佳选择。

在所有这些冲突中,一种较新类型的模型正在兴起:小型语言模型(SLMs)。这些是在较小数据集上训练的更简单模型,用于执行非常特定的功能。它满足了高效率、更多信任和低成本的所有要求。

一些最近的研究还表明,小型语言模型是代理人工智能的未来。在本文中,我列出了SLM比LLM更高效的用例。

不同业务功能中的顶级SLM用例

如果你想知道从哪里开始你的SLM之旅,我在下面汇编了跨常见业务功能的最佳SLM用例。 

客户服务

LLM模型可以对客户服务有所帮助,但有重大注意事项。这些模型是在庞大的数据集上预先训练的,通常是从互联网上抓取的。其中一些知识可能适用于你的客户服务,也可能不适用,特别是当公司政策具体时。你面临着拥有产生幻觉的面向客户的聊天机器人的风险。例如,加拿大航空网站上的客户服务聊天机器人承诺向客户提供丧亲退款,而这一政策从未存在过。

SLMs对客户聊天机器人和投诉门户更有意义。这些门户通常处理高度重复的问题/查询,并有有限的公司政策库可供参考。该模型可以轻松地在过去的客户工单数据和公司政策上进行训练。这足以让模型回答客户问题。

当然,SLM不能处理所有事情,当机器人无法回答查询时,你总是可以让人类参与。如果是聊天机器人,你可以提供支持电话号码供客户拨打。如果是工单管理平台,如果是SLM已知的问题,工单可以自动解决,否则分配给客户支持人员。至少,你可以放心,自动化不会向客户承诺不可能实现的事情。

​销售/营销 

LLMs在销售和营销的某些用例中确实表现出色,特别是内容创建。更大的训练数据有助于处理不同主题。但对于更专业的任务,如潜在客户资格认定/培养和个性化外联,使用LLMs可能不是最佳选择。其泛化的回应不会给你的潜在客户留下好印象。

SLM帮助你创建更个性化的外联信息。它可以在你的专有数据集上进行训练,以确定潜在客户资格。你可以起草一些过去对你有效的外联信息,并使用SLM模型基于它们生成更多外联信息。SLMs帮助你摆脱通用的AI外联信息。

金融 

LLMs可用于一般市场分析。但对于高风险任务如欺诈检测和合规监控,它落后了。欺诈率正在上升,无论是消费者还是企业账户。尽管公司建立了欺诈检测系统,欺诈者不断找到新方法绕过它们。模型需要持续再训练。这正是SLM大放异彩而LLM退居二线的地方。

与SLM相比,重新训练LLM需要更多时间和资源。SLM可以不断更新最新的欺诈数据,使系统更加健壮。

合规数据也是如此。LLMs甚至可能有过时的合规信息,导致遗漏。在小数据集上训练的SLM易于审查和完善,确保知识库中只有最新的法规。

人力资源 

LLMs非常适合起草一般职位描述、员工沟通或培训内容。具有高合规风险的任务(例如:创建政策文件、雇佣协议和移民文件)是事情变得棘手的地方。

国家甚至州都在不断更新其劳动法。例如,澳大利亚政府将产假增加到2025年的24周,从2026年开始将再延长两周。纽约最近提高了零工工人的最低时薪。日本开始推广工作与生活平衡以及为新父母提供灵活工作安排

使用LLMs意味着持续检查后端知识库是否准确和最新。在数据库中错误地遗漏任何旧政策文件都会导致幻觉。  

小型语言模型意味着对知识库有更多控制,并为合规提供更多保证。例如,Deel AI是由其合规专家策划的小型语言模型。这些专家不断更新知识库,因此你可以获得最新和最准确的答案。

业务运营

G2的一项新AI采用调查显示,近75%的企业在日常业务运营中使用多种AI功能。AI正在提高运营效率和生产力。SLM和LLM在其中都发挥着作用。

LLMs在战略任务如风险管理、需求预测、供应商审查等方面表现出色。其庞大的知识库帮助它在提出建议前考虑所有角度。另一方面,SLM最适合重复性的基础工作。想想发票管理、货物跟踪、路线优化、背景调查或预测性维护。这些任务可以在有限的规则集和公司过去的数据上运行。

公司正从在常规、重复性任务中使用SLM中受益。例如,员工背景筛查平台Checkr从LLM转向SLM以自动化背景调查,并看到了更好的准确性、更快的响应时间和5倍的成本降低。

SLM vs LLM:谁赢得了战斗?

在SLM和LLM的比较中,答案不是在SLM和LLM之间选择。更好的方法是将它们一起作为混合模型使用。SLM和LLM都有各自的优势和劣势。SLM在具有明确范围和有限数据集的任务中表现良好。但对于需要推理的任务,LLM是更好的选择。

以供应链管理为例。混合方法更适合供应链管理,其中:

  • LLM承担战略任务,如风险分析、需求预测等
  • SLM自动化高容量和重复性操作任务,如路线管理、发票处理等

同时使用SLM和LLM创建了一个完整的模型,可以处理供应链的所有细节。​

准备好进行自定义训练的顶级SLM模型

开始SLM实施的一个好处是有可用于微调的模型。你可以根据你的用例选择以下之一:

  1. Meta Llama 3.1(80亿参数):一个高效率模型,在需要多语言支持的用例中脱颖而出
  2. Microsoft Phi-3(38亿参数):当你有需要强大推理能力的超特定任务时,这是一个完美的微型模型。
  3. Google Gemma 2(20亿参数):一个具有多模态能力的轻量级模型,帮助你处理文本和图像。

使用SLMs从未如此简单

随着更多SLM模型的推出,你甚至不必从头开始创建任何模型。只需选择适合你用例的现有模型,为其构建信息知识库,你就可以开始了。  

\n

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

您可能也会喜欢

Solana Treasury Stocks: 为什么这些公司正在大量购买SOL?

Solana Treasury Stocks: 为什么这些公司正在大量购买SOL?

这篇文章《Solana 国库股票:为什么这些公司大量购买 SOL?》发表在 BitcoinEthereumNews.com。在 2020 年,大家都看到 Strategy(当时称为 Microstrategy)大量购入比特币,使企业加密货币国库成为主流话题。现在,一股新浪潮正在形成。而它以 Solana 为中心。数十家公司持有 SOL 作为对价格的押注。但他们不仅仅是持有。他们正在建立所谓的 Solana 国库或数字资产国库(DATs)。这些不是被动的金库。它们是积极的策略,进行质押、赚取收益,并与快速增长的 Solana 生态系统相连。在纳斯达克上市的公司 Forward Industries 最近购买了超过 680 万枚 SOL,使其成为全球最大的 Solana 国库公司。其他如 Helius Medical、Upexi 和 DeFi Development 也在遵循类似的策略,将 SOL 变成其资产负债表的核心。趋势很明显:Solana 国库股票正在成为一类新的加密货币相关股票。对投资者来说,问题不仅是谁在买入,还有为什么这种策略传播得如此之快。主要亮点:Solana 国库(DATs)是企业 SOL 储备,旨在通过质押和 DeFi 赚取收益。Forward Industries、Helius Medical、Upexi 和 DeFi Development Corp 等公司现在持有数百万枚 SOL。上市公司共持有 1710 万枚 SOL(约 40 亿美元),这使 Solana 成为最被采用的国库之一。与比特币国库不同,Solana 持有量每年产生 6-8% 的回报。它使储备变成了生产性资产。Solana 国库股票正在成为投资者间接接触 SOL 的新方式。风险依然存在:波动性、监管和集中持有。但企业采用正在迅速增长。什么是 Solana 国库(DAT)?Solana 国库,有时称为数字资产国库(DAT),是指公司在其资产负债表中持有 SOL。但与比特币国库不同,这些通常不仅仅是存放在冷存储中的静态储备。关键区别在于生产力。SOL 可以直接质押...
分享
BitcoinEthereumNews2025/09/21 06:09
权力新轴心:沃什、德鲁肯米勒、贝森特与下一任美联储主席

权力新轴心:沃什、德鲁肯米勒、贝森特与下一任美联储主席

为什么沃什作为美联储主席的潜在角色至关重要
分享
Jinsehot2025/12/15 12:10