预测模型基线资料比较

预测模型:我把数据按7:3的比例随机分为建模和验证组,然后比较俩组基线资料的水平。我想请教关于连续变量能否用两独立样本t检验进行比较的几个问题。1.关于正态性检验:对于一个连续变量是否建模和验证组都要分别进行正态性检验?还是只要判断这个这个变量全部数据是否符合正态性?2:是否要进行方差齐性检验?我觉得都是随机比例分的,可能不需要,不知道对不对?3.如果根据图形判断数据大概是正态性,但是正态检验结果p<0.05.,我选预测模型择那一个呢?我的样本量为1500。