您好,想就此篇文中例子,请教关于长期以来的困惑——1.关于因变量(depende

您好,想就此篇文中例子,请教关于长期以来的困惑——

1.关于因变量(dependent variable)和自变量(independent variable)在R*C列联表中的位置问题。

2.因变量是否是结局变量(分析变量),而自变量是否是分组变量?

本文中年龄是否会影响血脂的例子(年龄增加是因,高血脂是果):似乎年龄是自变量和分组变量,血脂是因变量和结局变量。(不知道我这里理解对了没有?)

问题1:

看到一篇帖子里写 By convention, the independent variable is usually placed in the columns and the dependent variable is placed in the rows.The row totals are found along the left side, and the column totals are found along the bottom.【1】 

而根据以上理论(当然它说的是常规来说,不是一定),年龄应该将Age放在Column(文中放在Raw),Dyslipidemia放在Raw(文中放在Column)。

这产生的第一个问题是:R*C中,这样R*C互换,是否会影响卡方计算结果?

问题2:

在医咖会另外一篇帖子“卡方检验及其错误应用——有“率”未必“卡方”【2】中指出,分类资料组间比较中,选择的方法与分类变量关系不大,主要看结局指标的类型和研究设计。据此理论,年龄若为分组变量(同时也是有序分类变量),血脂若是结局变量(无序二分类变量),是不是直接用普通卡方检验就可以?

非统计专业人士,问题业余还请海涵,期待您的回复。

【1】https://soc.utah.edu/sociology3112/bivariate-tables.php

【2】https://www.mediecogroup.com/method_topic_article_detail/334/?ty=methods