分享
从零入门多模态大模型数据合成-大家评论版
输入“/”快速插入内容
🎞️
从零入门多模态大模型数据合成-大家评论版
2024年8月10日创建
3045
4334
2
7
💬
当前文档为全网可编辑的版本,大家有啥经验都可以往上填
学习第一步:报名赛事!(点击即可跳转)
赛事链接
:
https://tian
r
chi.aliyun.com/competition/entrance/532251
💡
直接报名即可,然后可以尝试自己阅读赛题,
尝试理解和学习赛事要求
50%
50%
💡
天池Better Synth多模态大模型数据合成挑战赛
是 Datawhale 2024 年 AI 夏令营第四期的学习活动——
•
适合想
入门并实践 多模态大模型、数据处理、模型训练
的学习者参与
温馨提示
:
本赛事需要耗费大量的算力,跑通此baseline至少需要
120G内存
以上的
A10
,整个流程可能需要5小时,大家请自备算力,预留好时间,下面我们会以阿里云为例。
学习内容提要
:使用已有大模型和技术,在限定的计算资源下合成高质量训练数据,以增强多模态大模型的图像理解能力
画板
60%
内容速览
40%
300 分钟
baseline指南!
💡
教程贡献者说:
我们整个学习活动,将带你 ——
•
跑通最简单的Baseline
(相信我,当前baseline已经写到最简单了,但需要的算力和学习实在不是常人&免费方案能hold住的)
•
了解竞赛核心考察点和难点
•
精读Baseline与了解进阶思路
当前环节目标:
300分钟
跑通
“天池Better Synth多模态大模型数据合成挑战赛”
!
千里之行,始于足下,从这里,开启你的 AI 学习之旅吧!