fisher判别分析
想请教一下判别分析相关问题。
因为自变量很多,先做了差异性分析和相关性分析,然后去构建的判别函数。过程中有一些问题不太明白。
1.是差异性分析和相关性分析都有显著性意义才纳入判别分析吗?
2.如果相关性分析结果是非线性相关,对其进行转换后成线性相关,那进行判别分析的时候,是采用原变量还是转换后的变量呢?
3.共线性诊断结果中VIF的界值一般取多少呢?如果VIF比较高,可否剔除该变量,剩余变量共线性诊断比较满意的情况下进行判别分析呢?
4.自变量数目有没有要求呢?最少?最多?如果有8个变量可纳入判别分析,是随机组合反复尝试来寻找最优的那个函数吗?自变量多的情况下按这样尝试需要很多很多次,有没有什么其他好的方法呢?
5.如果是多类判别,比如3类,书上讲要找r个投射方向,用r个判别函数构造判别规则,最后基于r个判别函数计算待判样品与各类样本指标变量均数间的距离,没太明白这个怎么做,另外多类判别误判概率P怎么表示和计算,误判概率什么范围函数有应用价值呢?