问题 | 回答 |
老师,我上传数据是显示报错 Failed to fetch dynamically imported module | 见下方Task1 QA汇总第8问 |
怎么扩充数据集呢 | 可以找网上全国各地的考试题填充,但需要注意数据处理的问题 |
提分策略能否多演示一下 | 提分策略比较多,涉及数据集大小、学习率和轮数等多个因素,但由于时间成本并不便于展示;推荐多次尝试总结经验,并与其他学习者积极互动寻求答案 |
为啥一样的操作分数不一样啊 | 见下方Task1 QA汇总第7问 |
创建一个app在QA里没看到 | 见下方Task1 QA汇总第16问 |
用语文的模拟题可以吗,还是只能高考语文的 | 可以尝试语文模拟题对数据集进行扩充,赛题并未要求必须是高考题 |
今晚会讲代码么?还是说只是把飞书的教程过一遍 | 代码内容已经在今晚讲解了,可以看回放,也可以看注释自学 |
讯飞数据集里面直接数据增强有试过吗 | 不推荐使用,数据增强可能无法实现与赛题相符且有效的数据扩充 |
老师,微调的时候一般要训练多少次 | 这和模型训练效果有关。严格意义上讲,数据集、学习率大小等因素都和训练轮数有一定关系 |
程序怎么分清楚英文和中文阅读题 | 就数据清理部分而言,英文和中文选择题放在两个不同的文件,可以分开处理再合并;就大模型微调部分而言,模型训练本身就学习了多种语言的tokens,自然能分清不同的语言 |
看不到训练日志,只能在训练后根据结果推断训练情况吗 | 是的,微调过程是黑盒,不支持训练日志输出 |
尝试用讯飞的1:5增强总是运行失败 | 解答同上,不推荐使用数据增强,其本身产出效果无法衡量 |
这个微调的实现逻辑是怎样的,都和什么参数有关系。 | 底层是lora微调方法,具体内容可在TASK2中学习到 |
具体是微调哪里,还是多次训练能让分数变高 | lora微调方法调整的是Transformer架构中的一部分小批量参数,其能对模型效果产生较大影响;多次训练不一定能使分数变高,可能过拟合 |
本次赛事微调的分数高低主要是取决于数据集的扩充吗 | 数据集扩充是影响较大的因素,但不一定主要;prompt和数据清理等其他因素也同样很重要 |
有没有录屏 | 有的,下周二b站上传,今晚也可以直接看视频号 |
如果后面有更好的数据集,可以尝试少量的自动化调参吗 | 见下方Task1 QA汇总第3问 |
扩充数据集对微调性能提升大吗,平台上是不是只能用lora微调方法 | 扩充数据集对效果的影响是比较大的;平台目前只提供了lora微调方法 |
为什么target包含了多个题目和答案,没不是考虑把题目放到input,target直接答案。一道题目一个样本。这两种有区别吗 | 赛题的要求就是出多道选择题。推荐仔细阅读赛题官网的题目描述部分,充分理解题意 |
更换基础模型,应该是会影响分数的吧 | 赛事规定只能使用spark-13b完成比赛,用其他模型会出现错误 |
提升大模型性能主流方法是不是就rag、prompt和微调、扩充数据集、function calling这几个,企业目前会用一些进阶的方法吗 | 就本赛题而言提升大模型性能只能通过prompt、微调和扩充数据集,其他内容与本赛题无关,感兴趣可自行了解 |
所以这个比赛就是比谁的数据集扩充的好还有prompt做的好吗 | 就参赛者而言,是这样的;但能将这部分做好依旧有难度 |
老师,讯飞平台上训练时可以看到训练的过程吗 | 不能看到具体过程,平台的微调过程本身是黑盒 |
问题 | 回答 |
大模型微调需要配置什么代码环境么? | |
手册在哪儿找啊 | |
英语题有的答案后面有具体内容,有的只有选项,是不是只有具体内容的更好 | |
请问代码有链接地址吗? | |
是用什么什么软件扫描一遍整个训练集吗? | Pandas |
QA文档在哪儿看啊 | |