分享
开源大模型食用指南
输入“/”快速插入内容
🧑💻
开源大模型食用指南
2024年3月18日创建
17807
19562
🏆
适合谁来学:
希望长期、低成本、私有化、大规模应用开源LLM的学习者
开源大模型一站式最佳实践指南,包括
环境配置、本地部署、高效微调
等技能在内的全流程指导
项目负责人:
用户883
用户883
持续更新
全球开源大模型的最佳实践
,让更多的普通学生、研究者更好地使用开源大模型,帮助大模型更简单快捷地融入到学习生活中
你的PR与issue很重要,如有帮助,欢迎
Star
:
https://github.com/datawhalechina/self-llm
屡次登上Github Trending
项目简介
本项目是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。
本项目的主要内容包括:
1.
基于 AutoDL 平台(可扩展,例如阿里云)的开源 LLM
环境配置指南
,针对不同模型要求提供不同的详细环境配置步骤;
2.
针对国内外主流开源 LLM 的部署使用教程,包括
LLaMA、ChatGLM、InternLM
等;
3.
开源 LLM 的部署应用指导,包括
命令行调用、在线 Demo 部署、LangChain 框架集成
等;
4.
开源 LLM 的全量微调、高效微调方法,包括
分布式全量微调、LoRA、ptuning
等。
项目的主要内容就是教程,让更多的学生和未来的从业者了解和熟悉开源大模型的食用方法!
任何人都可以提出issue或是提交PR
,共同构建维护这个项目。
想要深度参与的同学可以联系我们,我们会将你加入到项目的维护者中。
学习建议:本项目的学习建议是,先学习环境配置,然后再学习模型的部署使用,最后再学习微调。因为环境配置是基础,模型的部署使用是基础,微调是进阶。初学者可以选择Qwen1.5,InternLM2,MiniCPM等模型优先学习。
项目意义
什么是大模型?
大模型(LLM)狭义上指基于深度学习算法进行训练的自然语言处理(NLP)模型,主要应用于自然语言理解和生成等领域,广义上还包括机器视觉(CV)大模型、多模态大模型和科学计算大模型等。
百模大战正值火热,开源 LLM 层出不穷。如今国内外已经涌现了众多优秀开源 LLM,国外如 LLaMA、Alpaca,国内如 ChatGLM、BaiChuan、InternLM(书生·浦语)等。开源 LLM 支持用户本地部署、私域微调,每一个人都可以在开源 LLM 的基础上打造专属于自己的独特大模型。