老师好,我想探讨乳腺癌的危险因素,我的自变量有49个,5000个观测值,但是其中有7个数据缺失大于20%,请问我是直接删去这些变量吗?其次,连续的自变量与因变量的logit转换值之间存在线性关系。假设6:自变量之间无多重共线性。假设7:没有明显的离群点、杠杆点和强影响点。前面4条假设数据是符合的,后面三条的假设我不知道该如何在stata中实现?