QA & 其他彩蛋

输入“/”快速插入内容

🎊
QA & 其他彩蛋

2024年8月3日创建

3103

3401

别忘了持续上分！我们赛事提交的网址在：

直播问题

1.
开营​

问题

回答

老师，我上传数据是显示报错 Failed to fetch dynamically imported module​

见下方Task1 QA汇总第8问

怎么扩充数据集呢

可以找网上全国各地的考试题填充，但需要注意数据处理的问题​

提分策略能否多演示一下

提分策略比较多，涉及数据集大小、学习率和轮数等多个因素，但由于时间成本并不便于展示；推荐多次尝试总结经验，并与其他学习者积极互动寻求答案​

为啥一样的操作分数不一样啊

见下方Task1 QA汇总第7问

创建一个app在QA里没看到

见下方Task1 QA汇总第16问

用语文的模拟题可以吗，还是只能高考语文的

可以尝试语文模拟题对数据集进行扩充，赛题并未要求必须是高考题​

今晚会讲代码么？还是说只是把飞书的教程过一遍

代码内容已经在今晚讲解了，可以看回放，也可以看注释自学​

讯飞数据集里面直接数据增强有试过吗

不推荐使用，数据增强可能无法实现与赛题相符且有效的数据扩充​

老师，微调的时候一般要训练多少次

这和模型训练效果有关。严格意义上讲，数据集、学习率大小等因素都和训练轮数有一定关系​

程序怎么分清楚英文和中文阅读题

就数据清理部分而言，英文和中文选择题放在两个不同的文件，可以分开处理再合并；就大模型微调部分而言，模型训练本身就学习了多种语言的tokens，自然能分清不同的语言​

看不到训练日志，只能在训练后根据结果推断训练情况吗

是的，微调过程是黑盒，不支持训练日志输出

尝试用讯飞的1：5增强总是运行失败

解答同上，不推荐使用数据增强，其本身产出效果无法衡量

这个微调的实现逻辑是怎样的，都和什么参数有关系。

底层是lora微调方法，具体内容可在TASK2中学习到

具体是微调哪里，还是多次训练能让分数变高

lora微调方法调整的是Transformer架构中的一部分小批量参数，其能对模型效果产生较大影响；多次训练不一定能使分数变高，可能过拟合​

本次赛事微调的分数高低主要是取决于数据集的扩充吗

数据集扩充是影响较大的因素，但不一定主要；prompt和数据清理等其他因素也同样很重要​

有没有录屏

有的，下周二b站上传，今晚也可以直接看视频号

如果后面有更好的数据集，可以尝试少量的自动化调参吗

见下方Task1 QA汇总第3问

扩充数据集对微调性能提升大吗，平台上是不是只能用lora微调方法​

扩充数据集对效果的影响是比较大的；平台目前只提供了lora微调方法​

为什么target包含了多个题目和答案，没不是考虑把题目放到input，target直接答案。一道题目一个样本。这两种有区别吗​

赛题的要求就是出多道选择题。推荐仔细阅读赛题官网的题目描述部分，充分理解题意​

更换基础模型，应该是会影响分数的吧

赛事规定只能使用spark-13b完成比赛，用其他模型会出现错误

提升大模型性能主流方法是不是就rag、prompt和微调、扩充数据集、function calling这几个，企业目前会用一些进阶的方法吗​

就本赛题而言提升大模型性能只能通过prompt、微调和扩充数据集，其他内容与本赛题无关，感兴趣可自行了解​

所以这个比赛就是比谁的数据集扩充的好还有prompt做的好吗

就参赛者而言，是这样的；但能将这部分做好依旧有难度

老师，讯飞平台上训练时可以看到训练的过程吗

不能看到具体过程，平台的微调过程本身是黑盒

2.
baseline精读直播​

问题

回答

大模型微调需要配置什么代码环境么？

手册在哪儿找啊

英语题有的答案后面有具体内容，有的只有选项，是不是只有具体内容的更好​

请问代码有链接地址吗？

是用什么什么软件扫描一遍整个训练集吗？

Pandas

QA文档在哪儿看啊