如何选择适合企业需求的大语言模型 原创

发布于 2024-9-13 12:29
浏览
0收藏

LLM正在推动各行各业的突破和效率。在选择一种模型时,企业应该考虑预期的应用、速度、安全、成本、语言和易用性。

虽然与其他人工智能(AI)技术相比,生成式AI比较新,但它已经被用于支持从审查求职者到诊断和推荐疾病治疗的一系列任务。IDC预测,到2028年,80%的首席信息官将依靠生成式AI工具来加快分析、促进决策和改善客户服务等。

企业正在竞相挖掘这项技术的潜力,以提高客户满意度和员工生产力。为此,它们正在考虑使用最适合支持生成式AI应用的大语言模型(LLM),比如AI copilot和聊天机器人。

了解LLM的多样性

如今市面上有大量的LLM可供选择,这意味着企业更有可能找到适合自己特定需求的LLM,而不是求助于一应俱全的LLM。这可以加速创新,不过从数百种模型中选择合适的模型可能很复杂。

在选择LLM时,企业应该考虑其预期的应用、速度、安全、成本、语言和易用性。

模型类型包括:

  • 商业模型:在医疗保健和金融服务行业很流行,这类模型通常用于涉及专门定制或安全限制的项目。
  • 开源模型:由于可访问性和成本优势,这类模型经常被初创公司和小企业用于研究。
  • 通用模型:这类模型使用大量数据加以训练,可以用作构建定制AI应用程序的基础模型。
  • 针对特定领域的模型:这类模型经过训练以适应特定的行业或用例,比如医疗保健或金融服务。
  • 针对特定任务的模型:这类度身定制的模型针对单一自然语言处理(NLP)功能进行了优化,比如摘要、答题或翻译。
  • 视觉语言模型:这类模型被称为VLM,结合了计算机视觉和NLP,从文本描述中生成图像,并从图像中识别物体。同时使用文本和代码让它们可以在不直接使用视觉数据训练的情况下创建和理解图像。

考虑模型的大小也很重要,因为这将影响其功能和局限性。一些因素包括如下:

  • 推理速度:较小的模型通常提供较短的推理时间,实现实时处理,提高能效并节省成本。
  • 准确性:使用检索增强生成(RAG)改善的大型模型常常会获得更高的准确性。
  • 可部署性:较小的模型非常适合边缘设备和移动应用程序,而较大的模型最好在云端或数据中心运行。
  • 成本:较大的模型需要更多的计算基础设施来运行。

开发者还应该基于谁将使用AI模型、应用于何处,考虑AI模型必须支持哪些语言。这在现代工作场所显得尤为重要,因为员工可能说多种不同的语言。确保模型能够无缝翻译语言对于用户之间的有效沟通和协作至关重要。

此外,随着主权AI越来越重要,许多国家正在构建使用当地语言和数据集训练的专有模型。这使各国能够对AI保持控制权和自主权,确保这些技术的开发和应用符合其独特的文化、道德和法律标准。

企业如何使用LLM?

LLM支持各种AI应用,包括聊天机器人和预测分析工具,这些应用正在各行各业带来突破和效率。

  • 医疗保健业:Insilico Medicine是一家基于生成式AI的药物发现公司,它开发了一种新的LLM转换器:nach0,用于回答生物医学问题,并合成新分子。这种多领域模型使研究人员能够高效地处理和分析大型数据集,减少内存需求,提高处理速度,促进更有效的数据管理和组织。
  • 电信业:Amdocs正在使用其amAIz平台来提高业务效率,推动新的收入流,并改善客户体验。这包括一款客户计费代理,便于用户立即享用基于LLM的数据洞察和自动化,以解决客户计费问题。
  • 金融服务业:Bank Negara(又名BNI)正在整合Cloudera的AI Inference服务,以便使用生成式AI增强客户体验,并提高运营效率。这将使BNI能够在安全的企业环境中有效地部署和管理大规模AI模型,并提供高性能和数据隐私。

针对特定需求量身定制的不同模型允许快速实施AI解决方案和工具,以帮助自动处理冗余工作。这为人们腾出了更多的时间和空间,以便专注于对公司和组织带来价值的项目。

展望未来,开发者将竭力构建和部署能够增强行业特定应用的LLM,致力于改善系统之间的互操作性,降低运营成本,并提高效率。使用量身定制的LLM,企业可以构建满足其独特需求的AI应用程序,以提高客户满意度,并促进卓越运营。

原文标题:​Finding the right large language model for your needs​,作者:Amanda Saunders

©著作权归作者所有,如需转载,请注明出处,否则将追究法律责任
收藏
回复
举报
回复
相关推荐