2025年10月31日,预印本服务器arXiv.org的官方博客宣布了一项更新:今后向 arXiv 计算机科学(CS)分类提交的综述(survey/调研)与立场论文(position paper),必须先被正规期刊或会议接收并完成同行评审,且提交时需提供充分的评审通过证明。(例如DOI或期刊参考信息)
根据官方公告,此举的主要原因是为了应对日益严重的“论文洪水”问题。公告指出,特别是生成式AI和大型语言模型(LLM)的出现,使得撰写那些不包含新研究成果的论文变得“快速而简单”,导致arXiv收到了大量此类投稿。
此项新规旨在:
- 帮助读者更容易地找到由领域专家撰写的、有价值的综述和立场文件。
- 减轻审核(moderator)团队的负担,让他们能更专注于处理arXiv正式接受的内容类型(即新颖的研究成果)。
值得注意的是,arXiv在公告中特别澄清,这并非一项全新的政策,而是对现有政策的更严格执行。综述和立场文件从未被正式列为arXiv可接受的内容类型,过去只是因为收到的数量少且质量高,审核团队才酌情接受。
主要观点分类与讨论
在官方公告发布后,学术界和科技社区(如Reddit的r/MachineLearning板块、Hacker News等)立即引发了广泛讨论。观点主要分为两大类:
1. 理解与支持:应对AI“垃圾信息”的必要之举
许多研究人员对arXiv的决定表示理解,认为这是在AI生成内容泛滥的背景下,维护学术交流质量的必要“防御措施”。
对抗“学术垃圾”:核心支持观点认为,新规是抵御低质量、AI生成的“垃圾论文”的有效手段。有评论将这种现象比作对研究社区的“DDoS攻击”(分布式拒绝服务攻击),大量AI生成的综述论文正在淹没真正有价值的贡献。
维护arXiv的信誉:支持者认为,此举有助于保持arXiv作为快速传播前沿研究的平台信誉。如果不加以限制,arXiv可能会被视为低质量内容的聚集地,从而降低其在学术界的整体价值。
纠正“刷论文”动机:有评论指出,这一变化打击了那些“为了发表而发表”、试图通过AI工具快速增加论文数量来“游戏规则”的行为者。
2. 担忧与批评:合规学术工作的潜在阻碍
另一方观点则对新规可能带来的“副作用”表示严重关切,担心这会阻碍部分高质量学术成果的传播。
高质量综述的发表困境:这是最核心的担忧。许多高质量、深入的综述文章(例如长达80页的领域综述)在格式或篇幅上并不适合主流的计算机顶会(如NeurIPS, ICML等)。
期刊审稿周期过长:虽然这些论文可以投稿给期刊,但传统学术期刊的同行评审周期极其漫长(有时长达数年)。这完全违背了arXiv作为“预印本”服务器实现快速学术交流的初衷。在计算机科学这样发展迅猛的领域,一篇等了两年才发布的综述可能已经过时了。
“立场文件”的价值被忽视:立场文件(Position Papers)通常用于提出前瞻性、批判性或具有争议性的新观点,它们本身不一定包含“新数据”,但对学科发展至关重要。新规可能会压制这类重要学术讨论的早期传播。
“一刀切”的问题:批评者认为,arXiv此举是为了解决AI生成内容的问题,但却用“一刀切”的办法,可能“把孩子和洗澡水一起倒掉了”,牺牲了那些由人类专家撰写的、有深度有价值的综述和立场文件。
参考来源:
https://blog.arxiv.org/2025/10/31/attention-authors-updated-practice-for-review-articles-and-position-papers-in-arxiv-cs-category/
https://www.reddit.com/r/MachineLearning/comments/1ol8wup/darxivcstostopacceptingliterature/https://news.ycombinator.com/item?id=45782136
一审:周书勤 二审:赵婧 三审:赵苗苗 原文链接:https://mp.weixin.qq.com/s/yW5TEzrbikF6Jq5W5TGnag

