多元logistics回归分析

各位老师好,我通过问卷收集了自动驾驶汽车的跟车行为数据,想进行多元logistics回归分析。

因变量是与前车距离:“短”,“一般”,“长” 构成。

自变量是十几个;性别、年龄、驾龄。。。。

这里的年龄是18岁以下、18-25岁、25-30岁、31-40岁、40-50岁、50岁以上。驾龄是一年以下、1-3年、3-5年、5年以上构成,这些自变量要进行哑变量设置。但十几个自变量都是这样的问题,所以这些十几个自变量是否都需要进行哑变量设置吗?

然后是收集的数据存在缺失值问题,问卷两次发放,第一次发放收集到68个数据,第二次收集56个数据,但是第二次发放的时候,删除了几道题,又增加了4道题,所以存在缺失值。这些缺失的变量是不能用吗?