近日一篇关于社会科学研究的社论引发广泛讨论。社论指出社会科学研究结果可重复性差的问题长期存在部分人士甚至借此否定整个社会科学领域的价值。事实上在人类行为这一复杂领域中研究结果难以重复的原因是多方面的包括研究方法、统计数据的误用以及样本特征的差异等。牛津大学约翰·里切尔博士指出上述问题背后有一个鲜少被讨论的深层原因社会科学缺乏对日常环境中人类行为的系统性观察而这种观察方式恰恰是自然科学研究其他物种行为的基本方法。他援引哲学家索伦·克尔凯郭尔1843年的名言——生命只能向后理解却必须向前生活——指出社会科学往往将那些为向前生活而形成的文化词汇直接套用为向后理解的科学概念。文化词汇随时间演变、因文化而异且带有强烈的主观色彩这使得以这类词汇为基础的研究天然地难以被重复验证。坎贝尔协作组织首席执行官威尔·莫伊则从更宏观的角度表达了乐观态度。他认为人类对自身行为和社会运作的认知远比对星空、海洋乃至人体的了解更为有限社会科学将成为人类探索的最后一片伟大疆域。然而目前社会科学所使用的工具与现代天文观测设备相比仍处于伽利略望远镜的水准。他强调数据是自然科学的核心驱动力同样也将成为社会科学和AI发展的根本燃料。大语言模型若要真正兑现其潜力必须与世界模型和人类行为模型协同发展。为此社会各界需要大力投资公共数据基础设施在覆盖范围、更新速度、数据体量和细节精度上实现数量级的提升这将同时为科学进步和政府决策提供坚实的原材料。斯特灵大学行为科学硕士项目主任大卫·科默福德教授则聚焦于提升科学研究可靠性的具体路径。他认为当前科研人员的招聘与晋升体系几乎完全以著作成果为导向对同行评审贡献的认可度几乎为零。他建议应将研究者的同行评审活动纳入学术评价体系。目前Web of Science研究者主页和ORCID平台已支持记录评审活动只需进一步完善机制由期刊编辑对高质量评审给予积分奖励对劣质评审予以扣分即可激励研究者认真投入同行评审工作从而在问题结果进入文献之前加以识别和拦截。他强调双盲同行评审仍是人类迄今发现的最不差的真理识别机制完善这一机制对所有人均有裨益。QAQ1社会科学研究结果为何难以被重复验证A社会科学研究结果难以重复原因是多方面的。首先研究方法和统计数据的误用会影响结果的可靠性其次研究缺乏对人类日常行为的系统性直接观察此外社会科学大量借用文化词汇作为科学概念而这些词汇本身随时间变化、因文化而异并带有主观色彩导致基于这类概念的研究天然难以被重复。Q2大语言模型与社会科学研究有什么关联A大语言模型若要真正发挥其潜力需要与世界模型和人类行为模型协同发展。数据是推动自然科学和AI发展的核心驱动力同样也将成为社会科学进步的关键燃料。因此社会各界需要投资建设高质量的公共数据基础设施在覆盖范围、更新速度、数据量和细节精度上大幅提升为科学研究和政府决策提供支撑。Q3如何通过同行评审机制提升社会科学研究的可靠性A可以将研究者的同行评审活动纳入学术评价体系。目前Web of Science和ORCID平台已支持记录评审活动可进一步完善机制由编辑对高质量评审给予积分奖励对劣质评审予以扣分。这样既能激励研究者认真开展同行评审及早发现问题研究也能帮助编辑更高效地找到合适的审稿人整体提升学术研究的可靠性。