QA|其他彩蛋
输入“/”快速插入内容
🎊
QA|其他彩蛋
2024年6月27日创建
1971
2232
0
0
Task1
直播问题
:
1.
train和test的数据是怎么收集的
2.
如何进行数据增强
3.
特征工程那部分参数怎么选择的呢
4.
train和test的数据是怎么收集的呀
5.
如何进行数据增强
6.
请问为什么选择决策树呢
7.
为什么选择决策树?是否有其他的方案?
8.
每次跑baseline是不是都要进这个网址,然后进那个环境
9.
特征工程那部分参数怎么选择的呢
10.
可以自己在baseline的基础上改代码吗?
11.
我们的任务就是优化代码看最后的分数有多高吗
12.
怎么用优化算法调参
13.
请解释一下数据源的字段。
14.
可以讲讲对数器怎么实现吗
15.
baseline 可以提交好几次吗?
16.
为什么必须认证后才能提交结果?
17.
怎么打卡?
18.
一定得带tag么
19.
有回放吗
20.
带官方tag的学习笔记怎么弄
21.
今晚直播有回放嘛? 有的
Task02直播问题:
1.
怎么确定那些特征是没用的
2.
数据集里的字段是怎么确定的
3.
训练集非空值小于10不用删除么?
4.
为什么处理出来的数据集还有900个特征
5.
删除缺失数据百分比是经验值还是算法的规定
6.
tifdf 是训练好的模型么?
7.
特征的相关性应该怎么去算呢?
8.
能不能用回归模型预测测试集的DC50和DMAX值,再根据分类规则分类
9.
需要panda基础么?
10.
多加上去的数据会不会把原来的数据重要性覆盖
11.
代码要在那里运行
12.
数据标签不均衡,用SMOTE效果会不会好点?
13.
测试集和数据集的比例怎么确定?
14.
交叉验证的目的是什么,把所有数据一起做验证的效果会不如交叉验证么?
15.
按照类别数去划分阈值会不会好些?
16.
本地如何测分数,用什么函数去评估呢?
17.
用StratifiedKFold分层抽样,效果会不会好点?
18.
xgb,lgb,cat选哪个呢?为啥task1是lgb,task3是cat?