多名reader和AI阅片比较

大佬们,现在做的课题是比较AI模型和reader(医生)的阅片能力,我有个疑惑,AI阅读n例,但是如果我有3名reader,那要怎么比较reader总体和AI呢?是把reader阅读的看成一个整体,就是reader总体阅读3n例吗?