🧑‍💻
开源大模型食用指南

2024年3月18日创建

17807

19562

🏆

适合谁来学：希望长期、低成本、私有化、大规模应用开源LLM的学习者​

开源大模型一站式最佳实践指南，包括环境配置、本地部署、高效微调等技能在内的全流程指导​

项目负责人：

用户883

持续更新全球开源大模型的最佳实践，让更多的普通学生、研究者更好地使用开源大模型，帮助大模型更简单快捷地融入到学习生活中​

你的PR与issue很重要，如有帮助，欢迎Star：https://github.com/datawhalechina/self-llm

common.docs_name - LarkCCM_Docs_Menu_Image

屡次登上Github Trending

项目简介

  本项目是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程，针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导，简化开源大模型的部署、使用和应用流程，让更多的普通学生、研究者更好地使用开源大模型，帮助开源、自由的大模型更快融入到普通学习者的生活中。​

本项目的主要内容包括：

1.
基于 AutoDL 平台（可扩展，例如阿里云）的开源 LLM 环境配置指南，针对不同模型要求提供不同的详细环境配置步骤；​

2.
针对国内外主流开源 LLM 的部署使用教程，包括 LLaMA、ChatGLM、InternLM 等；​

3.
开源 LLM 的部署应用指导，包括命令行调用、在线 Demo 部署、LangChain 框架集成等；​

4.
开源 LLM 的全量微调、高效微调方法，包括分布式全量微调、LoRA、ptuning 等。​

  项目的主要内容就是教程，让更多的学生和未来的从业者了解和熟悉开源大模型的食用方法！任何人都可以提出issue或是提交PR，共同构建维护这个项目。​

  想要深度参与的同学可以联系我们，我们会将你加入到项目的维护者中。​

  学习建议：本项目的学习建议是，先学习环境配置，然后再学习模型的部署使用，最后再学习微调。因为环境配置是基础，模型的部署使用是基础，微调是进阶。初学者可以选择Qwen1.5，InternLM2，MiniCPM等模型优先学习。​

项目意义

什么是大模型？

大模型（LLM）狭义上指基于深度学习算法进行训练的自然语言处理（NLP）模型，主要应用于自然语言理解和生成等领域，广义上还包括机器视觉（CV）大模型、多模态大模型和科学计算大模型等。​

  百模大战正值火热，开源 LLM 层出不穷。如今国内外已经涌现了众多优秀开源 LLM，国外如 LLaMA、Alpaca，国内如 ChatGLM、BaiChuan、InternLM（书生·浦语）等。开源 LLM 支持用户本地部署、私域微调，每一个人都可以在开源 LLM 的基础上打造专属于自己的独特大模型。​