大型语言模型(LLMs)继续在效率与信任之间走钢丝。用户认为它有效,但怀疑其准确性。
对某些用例而言,它也可能是过度使用。例如,考虑到其高计算成本,使用LLMs可能不是所有内部人力资源任务的最佳选择。
在所有这些冲突中,一种较新类型的模型正在兴起:小型语言模型(SLMs)。这些是在较小数据集上训练的更简单模型,用于执行非常特定的功能。它满足了高效率、更多信任和低成本的所有要求。
一些最近的研究还表明,小型语言模型是代理人工智能的未来。在本文中,我列出了SLM比LLM更高效的用例。
如果你想知道从哪里开始你的SLM之旅,我在下面汇编了跨常见业务功能的最佳SLM用例。
LLM模型可以对客户服务有所帮助,但有重大注意事项。这些模型是在庞大的数据集上预先训练的,通常是从互联网上抓取的。其中一些知识可能适用于你的客户服务,也可能不适用,特别是当公司政策具体时。你面临着拥有产生幻觉的面向客户的聊天机器人的风险。例如,加拿大航空网站上的客户服务聊天机器人承诺向客户提供丧亲退款,而这一政策从未存在过。
SLMs对客户聊天机器人和投诉门户更有意义。这些门户通常处理高度重复的问题/查询,并有有限的公司政策库可供参考。该模型可以轻松地在过去的客户工单数据和公司政策上进行训练。这足以让模型回答客户问题。
当然,SLM不能处理所有事情,当机器人无法回答查询时,你总是可以让人类参与。如果是聊天机器人,你可以提供支持电话号码供客户拨打。如果是工单管理平台,如果是SLM已知的问题,工单可以自动解决,否则分配给客户支持人员。至少,你可以放心,自动化不会向客户承诺不可能实现的事情。
LLMs在销售和营销的某些用例中确实表现出色,特别是内容创建。更大的训练数据有助于处理不同主题。但对于更专业的任务,如潜在客户资格认定/培养和个性化外联,使用LLMs可能不是最佳选择。其泛化的回应不会给你的潜在客户留下好印象。
SLM帮助你创建更个性化的外联信息。它可以在你的专有数据集上进行训练,以确定潜在客户资格。你可以起草一些过去对你有效的外联信息,并使用SLM模型基于它们生成更多外联信息。SLMs帮助你摆脱通用的AI外联信息。
LLMs可用于一般市场分析。但对于高风险任务如欺诈检测和合规监控,它落后了。欺诈率正在上升,无论是消费者还是企业账户。尽管公司建立了欺诈检测系统,欺诈者不断找到新方法绕过它们。模型需要持续再训练。这正是SLM大放异彩而LLM退居二线的地方。
与SLM相比,重新训练LLM需要更多时间和资源。SLM可以不断更新最新的欺诈数据,使系统更加健壮。
合规数据也是如此。LLMs甚至可能有过时的合规信息,导致遗漏。在小数据集上训练的SLM易于审查和完善,确保知识库中只有最新的法规。
LLMs非常适合起草一般职位描述、员工沟通或培训内容。具有高合规风险的任务(例如:创建政策文件、雇佣协议和移民文件)是事情变得棘手的地方。
国家甚至州都在不断更新其劳动法。例如,澳大利亚政府将产假增加到2025年的24周,从2026年开始将再延长两周。纽约最近提高了零工工人的最低时薪。日本开始推广工作与生活平衡以及为新父母提供灵活工作安排。
使用LLMs意味着持续检查后端知识库是否准确和最新。在数据库中错误地遗漏任何旧政策文件都会导致幻觉。
小型语言模型意味着对知识库有更多控制,并为合规提供更多保证。例如,Deel AI是由其合规专家策划的小型语言模型。这些专家不断更新知识库,因此你可以获得最新和最准确的答案。
G2的一项新AI采用调查显示,近75%的企业在日常业务运营中使用多种AI功能。AI正在提高运营效率和生产力。SLM和LLM在其中都发挥着作用。
LLMs在战略任务如风险管理、需求预测、供应商审查等方面表现出色。其庞大的知识库帮助它在提出建议前考虑所有角度。另一方面,SLM最适合重复性的基础工作。想想发票管理、货物跟踪、路线优化、背景调查或预测性维护。这些任务可以在有限的规则集和公司过去的数据上运行。
公司正从在常规、重复性任务中使用SLM中受益。例如,员工背景筛查平台Checkr从LLM转向SLM以自动化背景调查,并看到了更好的准确性、更快的响应时间和5倍的成本降低。
在SLM和LLM的比较中,答案不是在SLM和LLM之间选择。更好的方法是将它们一起作为混合模型使用。SLM和LLM都有各自的优势和劣势。SLM在具有明确范围和有限数据集的任务中表现良好。但对于需要推理的任务,LLM是更好的选择。
以供应链管理为例。混合方法更适合供应链管理,其中:
同时使用SLM和LLM创建了一个完整的模型,可以处理供应链的所有细节。
开始SLM实施的一个好处是有可用于微调的模型。你可以根据你的用例选择以下之一:
随着更多SLM模型的推出,你甚至不必从头开始创建任何模型。只需选择适合你用例的现有模型,为其构建信息知识库,你就可以开始了。
\n


