我想知道某种疾病的发病高峰月份,统计了10年的数据,每年或多或少都存在差异,我想进行他们的合并,采用独立样本的成组比较,提示2016年与2018年,2018年与2019年间的月份分布差异有统计学意义。
所以我想问的是
1.我能否直接剔除2018年的数据进行其他年份的合并统计;
2.如果不行的话,我该怎么处理得到比较可靠的疾病发病高峰月份。
3.患者年份间月份的分布差异可以算作连续变量,采用t检验,还是只能用秩和检验。
麻烦了