什么是开源 LLM?

Discuss smarter ways to manage and optimize cv data.
Post Reply
rifat28dddd
Posts: 687
Joined: Fri Dec 27, 2024 12:31 pm

什么是开源 LLM?

Post by rifat28dddd »

什么是法学硕士 (LLM)?
LLM,即大型语言模型,是一种通用的 AI 文本生成器。它是所有 AI 聊天机器人、 AI 写作生成器以及大多数其他 AI 功能(如汇总搜索答案)的幕后推手。

摆脱了花哨的界面和其他变通方法,LLM 接受提示并生成答案。基于 LLM 构建的聊天机器人不会寻找关键字,因此它们可以用预设的响应来回答问题 — 相反,它们会尽力理解问题并做出适当的回答。

这就是法学硕士 (LLM) 真正起飞的原因:相同的模型(无论是否经过额外培训)可用于回应客户查询、撰写营销材料、总结会议记录以及做更多的事情。

但 LLM 只能处理文本,这就是 LMM 越来越受欢迎的原因:它们可以整合图像、手写笔记、音频、视频等。许多最大的模型现在都是 LMM。


LLM 主要有三大类别:专有、开放、开源。

GPT-4o 和 Claude 3.5 等专有模型是目前最受欢迎和最强大 韩国电报数据库 的模型之一,但它们是由私营公司开发和运营的。源代码、训练策略、模型权重,甚至参数数量等细节都是保密的。访问这些模型的唯一方法是通过用它们构建的聊天机器人或应用程序,或者通过 API。你不能直接在自己的服务器上运行 GPT-4o。

开放和开源模型更加自由。您可以从 Hugging Face 和其他模型平台下载 Llama 3、Gemma 2 和 DeepSeek R1,并在您自己的设备上运行它们,甚至可以使用您自己的数据重新训练它们以创建您自己的模型。开发人员可以在它们的基础上构建自己的聊天机器人和应用程序。您甚至可以深入研究模型权重和系统架构等内容,以了解它们的工作原理(尽我所能)。

那么开放和开源之间有什么区别呢?Meta 和 Google 等公司称 Llama 3 和 Gemma 2 是开放的,就好像它们与开源一样,但两者之间还是有重大区别的。

开源许可证非常宽松。大多数情况下,你必须同意将你用它构建的任何东西也开源——并注明原始开发者的出处。如果你想用开源软件创建一家价值数十亿美元的公司,或者创建一个告诉人们如何抢劫银行的犯罪聊天机器人,你完全可以自由地这样做。警方可能会对后一个项目有一些问题,但你不会违反任何软件许可证。

开放许可证仍然很宽松,但它们有一些额外的限制。例如,Llama 3 的许可证允许每月最多 7 亿用户进行商业使用,并阻止某些用途。你或我可以用它来构建一些东西,但苹果和谷歌不能。同样,Gemma 2 的禁止使用政策,除其他外,禁止“协助或鼓励用户犯下任何类型的罪行”。可以理解的是,谷歌不希望看到“由 Google Gemma 提供支持”的令人讨厌的机器人充斥在新闻中。
Post Reply