arXiv

![]() | |
![]() | |
网站类型 | 科学 |
---|---|
持有者 | 康奈尔大学 |
创始人 | 保罗·金斯巴格 |
网址 | arxiv |
商业性质 | 否 |
注册 | 可选 |
推出时间 | 1991年8月14日 |
ISSN | 2331-8422 |
OCLC号 | 228652809 |
arXiv(读音同archive,其中X依希腊文的χ发音)是一个面向全球科学家和研究人员的开放获取预印本网站,主要收录物理学、数学、计算机科学、生物学、定量金融学、统计学等多个学科领域的论文预印本。该平台自1991年8月创立以来,逐步发展成为公认最成功的开放获取数字系统之一[2]:56。截至2025年2月[update],arXiv.org已收集超过260万篇预印本[3]。
arXiv提供了一个免费、开放的知识库,使研究人员能够在正式投稿至期刊前或并行于期刊同行评审程序,将最新的研究成果以预印本的形式上传、存储和传播。用户无需支付费用即可访问和下载平台上的文献。
历史
[编辑]
紧凑的TeX文件格式使arXiv成为可能,该格式使科学论文可以轻松地通过互联网传输并呈现给客户端。在1990年左右,乔安妮·科恩开始以TeX文件的形式通过电子邮件将物理预印本发送给同事,但很快发送的论文数量太多,以至于装满邮箱。保罗·金斯巴格发现了中央存储的必要性,于1991年8月创建了一个中央仓库邮箱。该邮箱存储在洛斯阿拉莫斯国家实验室中,可以通过任何计算机访问。网站很快支持了其他访问方式:1991年起支持FTP,1992年起支持Gopher,1993年起支持万维网[4]。1999年,网站改名为arXiv.org。
arXiv最早是由物理学家保罗·金斯巴格在1991年建立的网站,本意在收集物理学的论文预印本,随后括及天文、数学等其它领域。金斯巴格因这个网站获得了2002年的麦克阿瑟奖。
arXiv原先挂在洛斯阿拉莫斯国家实验室(LANL),故早期被称为“LANL预印本数据库”。2001年arXiv的运营、编辑、经济和管理工作移交给康奈尔大学图书馆[5][2]:前言,并在全球各地设有镜像站点[2]:56。
2022年1月,arXiv与DataCite合作,为文章自动分配DOI。[6]
数据格式
[编辑]每篇arXiv论文都有一个唯一标识符:
YYMM.NNNNN
,例如1507.00123
,YYMM.NNNN
,例如0704.0001
,arch-ive/YYMMNNN
,用于早期论文,例如hep-th/9901001
.
同一篇论文的不同版本通过结尾的版本号确定,例如1709.08980v1
。若不提供版本号,则默认为最新版本。
arXiv采用分类系统。每篇论文都有一个或多个分类标记。部分分类具有两层,例如q-fin.TR
表示“计量金融学”(quantitative finance)分类中的“交易与市场微观结构”(Trading and Market Microstructure)。其它单层分类例如hep-ex
, 表示“高能物理实验”(high energy physics experiments)。
arXiv接受以多种格式投稿论文,包括LaTeX和通过TeX或LaTeX以外的文字处理器打印的PDF。 如果最终PDF文件生成失败、图像文件太大或提交的总大小太大,投稿会被拒绝。 现在,arXiv允许存储和修改不完整的投稿,并且仅在准备好后才能最终确定投稿。 完成投稿后,文章上会记有时间戳。
同行评审
[编辑]尽管arXiv上的文章未经同行评审,但arXiv在2004年起采行了一套“认可”系统。在这套系统下,作者首先要得到认可,这种认可可能来自另一位具认可资格者的背书,或者依照某些内部规定而自动授予。来自著名学术机关的作者通常会自动得到认可。包括诺贝尔物理奖得主布赖恩·约瑟夫森在内的十九位科学家曾抗议他们的部分文章被arXiv管理者退回,而其它文章则被强迫更改分类,依其见解,原因出在研究主题的争议性,或者是文章抵触了弦理论的正统观点[7]。
由于arXiv上的文章多半都会投稿到学术期刊,作者对文章多半保持严谨态度。少部分文章则一直保持预印本的形式,其中包括一些极具影响力的作品,例如格里戈里·佩雷尔曼对庞加莱猜想的证明。佩雷尔曼似乎放弃了传统的同行评审期刊程序,并指出:“如果有人对我解决问题的方式感兴趣,它就在[arXiv]上–让他们继续阅读。”[8]尽管采用了这种非传统的出版方法,其他数学家还是认可了这项工作,向佩雷尔曼提供了菲尔兹奖和克雷数学千年奖,但他都拒绝[9]。
arXiv上的民间科学家作品为数不多,通常被归入诸如“一般数学”(General Mathematics)的项下。
运营与管理
[编辑]自2001年转移至康奈尔大学图书馆后,arXiv的日常运营与发展均由该图书馆负责。图书馆承担了平台的技术维护、用户支持、内容存储和长期获取等职责,同时管理全球镜像网站以确保数据冗余和访问稳定性。[2]:66
arXiv的直接运营团队由约6名全职员工组成,其中大部分员工负责用户支持和系统管理[2]:71。同时arXiv通过与全球各地图书馆、研究实验室及基金会的合作,建立了会员制度和资助机制[2]:60-68。
为保障平台的可持续运营,arXiv建立了多元化的收入模式,包括[2]:60-62:
- 康奈尔大学图书馆资助:每年提供固定现金补贴,用于支持平台的日常运营及部分间接成本;
- 西蒙斯基金会:除每年提供直接资助外,还通过会员费匹配机制支持平台资金;
- 会员机构费用:全球会员机构根据分级制度,每年支付一定费用(通常为1500至3000美元),承诺为期5年的初始资金支持,以实现年度目标收入。
- 应急基金:用于应对突发支出和保障系统稳定性。
arXiv的治理体系包括[2]:66-67:
- 科学咨询委员会:由涵盖各学科的科学家和研究人员组成,为平台政策、存储标准及系统发展提供指导和监督。
- 会员咨询委员会:由会员机构选举代表组成,负责向康奈尔大学图书馆提供关于平台管理、运营、标准实施及财务规划的建议。
数据保存
[编辑]康奈尔大学图书馆采用标准备份程序,确保arXiv所有数据均能安全存储,同时纽约市的异地备份设施和全球镜像站点提供了地理冗余保护。arXiv优先接纳具备长期存档价值的文档格式,如TeX/LaTeX、PDF、HTML,并保留所有源文件,以便后续的灵活监控和处理。康奈尔大学图书馆还建立了档案知识库,以支持平台关键资源的长期保存和管理,并承担相关数据保存费用。[2]:72
影响
[编辑]arXiv的存在是造就科学出版业中所谓开放获取运动的因素之一。现今一些数学家和科学家习惯在将论文提交给专业学术期刊前先上传至arXiv。这一趋势对传统学术期刊的经营模式造成了可观的冲击。
参阅
[编辑]参考文献
[编辑]引用
[编辑]- ^ arxiv.org Site Overview. Alexa Internet. [2016-09-11]. (原始内容存档于2018-12-24).
- ^ 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 顾立平. 预印本平台(arXiv.org)简介. 北京: 科学技术文献出版社. 2016. ISBN 978-7518918805.
- ^ Monthly Submissions. arxiv.org. [2025-02-06].
- ^ Ginsparg, Paul. The global-village pioneers. Physics World. 2008-10-01 [2020-07-21]. (原始内容存档于2008-10-04).
- ^ Computing Research repository FAQs, Cornell University. [2008-03-29]. (原始内容存档于2008-07-25).
- ^ New arXiv articles are now automatically assigned DOIs. [4 April 2023]. (原始内容存档于2022-02-23).
- ^ archivefreedom.org. [2008-03-29]. (原始内容存档于2008-03-26).
- ^ Lobastova, Nadejda; Hirst, Michael. Maths genius living in poverty. Sydney Morning Herald. 2006-08-21 [2020-07-21]. (原始内容存档于2017-10-07).
- ^ Kaufman, Marc, Russian mathematician wins $1 million prize, but he appears to be happy with $0, Washington Post, 2010-07-02 [2020-07-21], (原始内容存档于2020-07-27)
其他参考文献
[编辑]- Butler, Declan. Biologists Join Physics Preprint Club. Nature. 2003-10-09, 425 (6958): 548 [2008-03-29]. doi:10.1038/425548b. (原始内容存档于2007-03-14).
- Butler, Declan. Los Alamos Loses Physics Archive as Preprint Pioneer Heads East. Nature. 2001-07-05, 412 (6842): 3–4 [2008-03-29]. doi:10.1038/35083708. (原始内容存档于2008-02-23).
- Choi, Charles Q. Biology's New Online Archive. The Scientist. 2003-09-30 [2008-03-29]. (原始内容存档于2005-03-13).
- Giles, Jim. Preprint Server Seeks Way to Halt Plagiarists. Nature. 2003-11-06, 426 (6962): 7 [2008-03-29]. doi:10.1038/426007a. (原始内容存档于2005-11-25).
- Ginsparg, Paul. Winners and Losers in the Global Research Village. The Serials Librarian. 1997, 30 (3/4): 83–95 [2008-03-29]. (原始内容存档于2017-10-19).
- Halpern, Joseph Y. A Computing Research Repository. D-Lib Magazine. November 1998 [2008-03-29]. (原始内容存档于2008-04-01).
- Halpern, Joseph Y. CoRR: A Computing Research Repository. Journal of Computer Documentation. 2000, 24 (2): 41–48. arXiv:cs.DL/0005003.
- Jackson, Allyn. From Preprints to E-prints: The Rise of Electronic Preprint Servers in Mathematics (PDF). Notices of the American Mathematical Society. 2002, 49 (1): 23–32 [2008-03-29]. (原始内容存档 (PDF)于2008-02-28).
- Luce, Richard E. E-Prints Intersect the Digital Library: Inside the Los Alamos arXiv. Issues in Science and Technology Librarianship. 2001, (29) [2008-03-29]. (原始内容存档于2008-02-20).
- McKiernan, Gerry. arXiv.org: The Los Alamos National Laboratory E-Print Server (PDF). The International Journal on Grey Literature. 2000, 1 (3): 127–138 [2008-03-29]. (原始内容 (PDF)存档于2005-05-05).
- Pinfield, Stephen. How Do Physicists Use an E-Print Archive? Implications for Institutional E-Print Services. D-Lib Magazine. 2001, 7 (12) [2008-03-29]. (原始内容存档于2008-03-04).
- Quigley, Brian. Physics Databases and the Los Alamos e-Print Archive. EContent. 2000, 23 (5): 22–26.
- Taubes, Gary. Publication by Electronic Mail Takes Physics by Storm. Science Magazine. 1993-02-26: 1246–1248.
- Warner, Simeon. Open Archives Initiative Protocol Development and Implementation at arXiv. 2001. arXiv:cs/0101027v1
.
- What Is q-bio?. Open Access Now. 2004-08-02 [2008-03-29]. (原始内容存档于2008-03-21).