经常以请教问题的理由,向陈高平问这问那。
尤其是询问测试集的细节。
身为师兄,陈高平对季雅妮进行了事无巨细的教导。
教着教着,他无奈地发现,季雅妮简直什么都不会,连一些常识性的问题都要反复询问。
这时他才意识到沈悠然到底有多厉害。
同样是刚进实验室的大一新生,沈悠然没有向陈高平请教过任何问题,一切全靠自学。
能力却变得比陈高平还要强,简直和组里的博士生没什么区别。
费了九牛二虎之力,陈高平总算让季雅妮初步踏入科研的门槛。
随着她参与模型的训练,一直到这周六,模型各项指标忽然突飞猛进。
比前代模型足足强了一倍,预测结果和测试集几乎百分百吻合。
难道季雅妮这姑娘有点幸运值在身上?
陈高平等几位负责这项研究的师兄师姐,还沉浸在突如其来的喜悦中。
如此优秀的测试结果,意味着他们的论文将更有机会发表在顶刊上。
但就在今天上午,沈悠然指出了问题。
“测试集不对劲。”
她指着电脑屏幕。
“和原来的测试集相比,现在的测试集有百分之五十的不同。”
话音刚落,所有人就像被泼了一盆冷水,面面相觑。
要知道,模型的性能正是在测试集上进行测试的。
如果说模型优化是一场考试,那么测试集就是这场考试的正确答案。
修改测试集,去匹配模型给出的测试结果?
简直就相当于为了提高考试分数,直接篡改考试答案一样荒谬。
陈高平立刻查询了数据库的访问记录,最终确定,对测试集进行修改的人正是季雅妮。
“不行,我要去和廖老师说一声。”
陈高平说着便离开实验室,打算前往廖老师的办公室汇报情况。
季雅妮捅出这么大的篓子,导致他们白欢喜一场。
原先的成果要全部作废,甚至可能要重新跑一次模型训练,这需要很长的时间。
可现在,论文投稿的时间窗口马上就要过去