问题 | 回答 |
bash download.sh时间过长,3-4个小时 | |
运行dj-process --config ./image_split_10.yaml时显示dj-process not dound | |
请文一下train_mgm_2b_stage_1_8GPU.sh 的the default setting is for 8 GPU还能调整麽? 往哪个方向可以上高分~ | |
data juicer 除了blip还支持哪些image caption模型呀,我换了一个总是运行出错 | |
一次 dj-process 处理数据集,可以多次训练吗 还是每次都需要重新训练,才能训练评测 | |
8卡的最优参数搭配是当前脚本 配置么() | |
8卡的训练脚本第20行和21行。还能调整麽 | |
请问Sandbox有相关文档吗? | 参考代码库box目录/直播PPT倒数第二页 |
生成的时候 为什么会多出来一棵树 | |
刚来,请问是哪个比赛呢? | 天池Better Synth多模态大模型数据合成挑战赛 |
256 和 128 的设定是什么原理 可以设置别的值吗 | |
这次直播课的 PPT 可否分享一下 呀 | 之后确定哦 |
怎么用小批量数据多次训练?(PPT中提到observation 8:较少量的 极高质量的 数据 重复若干次) | |
预训练和fineturn的任务是什么类型的任务呢?label 是什么呢 | |
数据清洗只用panda行吗 | |
第一次参加这个比赛,能不能给一些优秀案例做参考 | 我们有相关的baseline分享哦,可以自己去学习哈 |
中断后,如何读取之前的checkpoint接着训练呢 | |
用户数据、关系数据、内容数据、转发数据、评论数据、点赞数据、群组数据,用MongoDB,可以只用panda库写脚本吗 | |
GPU RTX 3090(24GB) * 8 CPU 120 vCPU Intel(R) Xeon(R) Platinum 8362 CPU @ 2.80GHz 内存 480GB 硬盘系统盘:150 GB【 设置size BATCH_SIZE_PER_GPU多少 才不被kill】 | |
GPURTX 4090(24GB)*3 升降配置 CPU48 vCPU Intel(R) Xeon(R) Gold 6430 内存360GB 硬盘250G 能带动吗 | |
能麻烦您在讲讲算子效能实验,单算子效能的表吗?信息有点大,NSFW影响最大? datapool (high)什么意思? | |
您们测试用的是什么配置 方便告知下麽 | |
如何控制生成的合成数据量?希望能够生成多样化的合成数据然后通过分选出最终的合成数据集。提交结果要求给出solution,如果我采用了多种方案生成的数据然后合并是要提供不同的数据对应的config和后处理的代码吗?我的意思是生成图片和生成字幕两种方式 | |
问题 | 回答 |
想问下autoDL可以不用nvdia 的a100吗?刚才提到说用两个rtx 4090,这个和a100区别是什么呢 | |
怎么避免幻觉的问题呢 | |