关于连续型定量资料的分级划分问题?

我正在研究一个新指标,该指标约呈右偏态分布,疾病状态增高,仅有正常上限无下限。前期已通过正常人的数据建立了预计值方程和正常参考范围。下一步想针对该指标的数值划分出轻、中、重的三种异常程度分级。我收集了几种疾病患者该指标的测量数据,这几种疾病基本上可以囊括临床上该指标的表现范围。收集总体患者的样本量较大,但不同疾病收集的患者数量差异较大。应该如何制定等级划分的阈值?

因总体数据不符合正态分布,且通过minitab尝试各种转换仍未能转换成正态分布,因此无法通过正态分布曲线划分。如果使用百分位数法划分,是不是会受到我收集的不同疾病的样本量的影响?有些疾病该指标会增高多一些,有些疾病则少一些。如果采用极值的间距做三等划分,似乎又会受到极值的影响?