相比GPT-3.5,GPT-4错误引用参考文献的问题解决了吗?
ChatGTP引用文献错误率一直很高,甚至有很多假的文献,不知道最新的GPT-4是否解决了这一问题。近期,《JAMA Netw Open》发了一篇Letter,测试了最新版本的GPT-4引用参考文献的准确性。
研究者在测试中,分别让GPT-4和GPT-3.5针对某个主题推荐参考文献,然后去验证参考文献的准确性。结果显示,GPT-3.5推荐的162篇文献,有159篇(98.1%)是假文章;GPT-4推荐的257篇文献,有53篇(20.6%)是假文章;GPT-4 的参考文献引用错误率显着低于 GPT-3.5 (P<0.001)。

也就是说,GPT-4已经大幅降低了引用错误率,但是仍然有错误,需要人工验证,而GPT-3.5则是完全不能相信其引用的参考文献。
参考文献:JAMA Netw Open. 2023;6(8):e2327647. doi:10.1001/jamanetworkopen.2023.27647