何时使用小型语言模型而非大型语言模型

作者：Hackernoon

2025/12/15 02:21

TOP$0.000096--%

大型语言模型（LLMs）继续在效率与信任之间走钢丝。用户认为它有效，但怀疑其准确性。

对某些用例而言，它也可能是过度使用。例如，考虑到其高计算成本，使用LLMs可能不是所有内部人力资源任务的最佳选择。

在所有这些冲突中，一种较新类型的模型正在兴起：小型语言模型（SLMs）。这些是在较小数据集上训练的更简单模型，用于执行非常特定的功能。它满足了高效率、更多信任和低成本的所有要求。

一些最近的研究还表明，小型语言模型是代理人工智能的未来。在本文中，我列出了SLM比LLM更高效的用例。

不同业务功能中的顶级SLM用例

如果你想知道从哪里开始你的SLM之旅，我在下面汇编了跨常见业务功能的最佳SLM用例。

客户服务

LLM模型可以对客户服务有所帮助，但有重大注意事项。这些模型是在庞大的数据集上预先训练的，通常是从互联网上抓取的。其中一些知识可能适用于你的客户服务，也可能不适用，特别是当公司政策具体时。你面临着拥有产生幻觉的面向客户的聊天机器人的风险。例如，加拿大航空网站上的客户服务聊天机器人承诺向客户提供丧亲退款，而这一政策从未存在过。

SLMs对客户聊天机器人和投诉门户更有意义。这些门户通常处理高度重复的问题/查询，并有有限的公司政策库可供参考。该模型可以轻松地在过去的客户工单数据和公司政策上进行训练。这足以让模型回答客户问题。

当然，SLM不能处理所有事情，当机器人无法回答查询时，你总是可以让人类参与。如果是聊天机器人，你可以提供支持电话号码供客户拨打。如果是工单管理平台，如果是SLM已知的问题，工单可以自动解决，否则分配给客户支持人员。至少，你可以放心，自动化不会向客户承诺不可能实现的事情。

销售/营销

LLMs在销售和营销的某些用例中确实表现出色，特别是内容创建。更大的训练数据有助于处理不同主题。但对于更专业的任务，如潜在客户资格认定/培养和个性化外联，使用LLMs可能不是最佳选择。其泛化的回应不会给你的潜在客户留下好印象。

SLM帮助你创建更个性化的外联信息。它可以在你的专有数据集上进行训练，以确定潜在客户资格。你可以起草一些过去对你有效的外联信息，并使用SLM模型基于它们生成更多外联信息。SLMs帮助你摆脱通用的AI外联信息。

金融

LLMs可用于一般市场分析。但对于高风险任务如欺诈检测和合规监控，它落后了。欺诈率正在上升，无论是消费者还是企业账户。尽管公司建立了欺诈检测系统，欺诈者不断找到新方法绕过它们。模型需要持续再训练。这正是SLM大放异彩而LLM退居二线的地方。

与SLM相比，重新训练LLM需要更多时间和资源。SLM可以不断更新最新的欺诈数据，使系统更加健壮。

合规数据也是如此。LLMs甚至可能有过时的合规信息，导致遗漏。在小数据集上训练的SLM易于审查和完善，确保知识库中只有最新的法规。

人力资源

LLMs非常适合起草一般职位描述、员工沟通或培训内容。具有高合规风险的任务（例如：创建政策文件、雇佣协议和移民文件）是事情变得棘手的地方。

国家甚至州都在不断更新其劳动法。例如，澳大利亚政府将产假增加到2025年的24周，从2026年开始将再延长两周。纽约最近提高了零工工人的最低时薪。日本开始推广工作与生活平衡以及为新父母提供灵活工作安排。

使用LLMs意味着持续检查后端知识库是否准确和最新。在数据库中错误地遗漏任何旧政策文件都会导致幻觉。

小型语言模型意味着对知识库有更多控制，并为合规提供更多保证。例如，Deel AI是由其合规专家策划的小型语言模型。这些专家不断更新知识库，因此你可以获得最新和最准确的答案。

业务运营

G2的一项新AI采用调查显示，近75%的企业在日常业务运营中使用多种AI功能。AI正在提高运营效率和生产力。SLM和LLM在其中都发挥着作用。

LLMs在战略任务如风险管理、需求预测、供应商审查等方面表现出色。其庞大的知识库帮助它在提出建议前考虑所有角度。另一方面，SLM最适合重复性的基础工作。想想发票管理、货物跟踪、路线优化、背景调查或预测性维护。这些任务可以在有限的规则集和公司过去的数据上运行。

公司正从在常规、重复性任务中使用SLM中受益。例如，员工背景筛查平台Checkr从LLM转向SLM以自动化背景调查，并看到了更好的准确性、更快的响应时间和5倍的成本降低。

SLM vs LLM：谁赢得了战斗？

在SLM和LLM的比较中，答案不是在SLM和LLM之间选择。更好的方法是将它们一起作为混合模型使用。SLM和LLM都有各自的优势和劣势。SLM在具有明确范围和有限数据集的任务中表现良好。但对于需要推理的任务，LLM是更好的选择。

以供应链管理为例。混合方法更适合供应链管理，其中：

LLM承担战略任务，如风险分析、需求预测等
SLM自动化高容量和重复性操作任务，如路线管理、发票处理等

同时使用SLM和LLM创建了一个完整的模型，可以处理供应链的所有细节。

准备好进行自定义训练的顶级SLM模型

开始SLM实施的一个好处是有可用于微调的模型。你可以根据你的用例选择以下之一：

Meta Llama 3.1（80亿参数）：一个高效率模型，在需要多语言支持的用例中脱颖而出
Microsoft Phi-3（38亿参数）：当你有需要强大推理能力的超特定任务时，这是一个完美的微型模型。
Google Gemma 2（20亿参数）：一个具有多模态能力的轻量级模型，帮助你处理文本和图像。

使用SLMs从未如此简单

随着更多SLM模型的推出，你甚至不必从头开始创建任何模型。只需选择适合你用例的现有模型，为其构建信息知识库，你就可以开始了。

免责声明: 本网站转载的文章均来源于公开平台，仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利，请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证，并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考，不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。