维基百科:使用时光机
本页为操作指南,用于介绍中文维基百科社群的一些实现和操作方式。 本文只是论述,不属于方针或指引。如果本指南与方针或指引起冲突或不一致,请以方针或指引的条文为准。 |
本页提供关于使用互联网档案馆的网站时光机(Wayback Machine)以通过维基百科条目引用网页的存档的信息。若网页出现变更、移动或者消失,原文链接会被保留。
编者亦被鼓励去添加一个存档链接作为引文的一部分,或者至少提供作为存档的引文URL,同时引文可被引用或更新。
访问https://archive.org/web/(可用HTTP连接访问http://archive.org/web/),输入感兴趣的网页的原始URL并点击BROWSE HISTORY按钮。接下来将会:
- 显示一个日历以列出该网页所有存档的副本的截取日期,
- 显示当前页的liveweb视图并开始归档进程,
- 重定向到最近存档的副本,或
- 显示错误信息解释该网页为何无法存档。
亦可直接手动存档,访问https://archive.org/web/,在页面右下角的“Save Page Now”处输入原始URL并点击SAVE PAGE按钮,接下来将会手动保存当天的页面。
URL格式
[编辑]“时光机”的链接通常以https://web.archive.org/web/开头并跟随一个星号或14位的引用日期和时间,再用斜杠连接原网页的URL。
起始请求
[编辑]以下例子展示链接到维基百科主页所有存档的日历。
* https://web.archive.org/'web/ '*/https://www.wikipedia.org/
使用上述URL格式以显示请求的页面存档的范围。 点击任意一个高亮的日期以选择指定的存档副本。
如果目标网页未被存档,页面底部会出现一个输入框,并带有“Save this url in the Wayback Machine”的链接,点击以后就会发送请求到:
* https://web.archive.org/save/https:// www.wikipedia.org/
上述URL将会显示请求页面当前版本并开始试图为此页归档的进程。 若存档成功,存档副本将在完成后立刻提供。
對於某些請求頁面,「時光機」會返回錯誤信息解釋網頁為何無法存檔。 這些情況下需要嘗試其他諸如archive .is的存檔服務。
特定的存档副本
[编辑]一旦目标网页被存档,任何一个特定的存档日期会下列格式单独请求。
下列链接示例为维基百科主页在2002年9月30日12:35:25 pm(UTC)的存档。日期和时间的格式为YYYYMMDDhhmmss。
使用上述格式会直接链接到指定的存档副本。
在日期后面(或在其中)添加一个星号是显示所有存档的日历的快捷方式。
最近的存档副本
[编辑]下列链接示例为存档页的最新版本。
使用上述格式会被重定向到完整格式的URL,包含14位的引用日期和时间戳,对于最近的存档副本来说,取代了使用存档直接链接特定的旧版本的目标。
同样,一个与之相似但带有数字1的URL链接最早的存档副本。
参见:Advanced URL locator hints and tips——Internet Archive
限制
[编辑]若要求存档的特定页面活动了仅仅几分钟,该页的存档副本一般不能在几日或几周后提供。
互联网档案馆尊重机器人排除标准并将不会为下列不被允许的页面存档。
例如,《纽约时报》有个地址为 http://www.nytimes.com/robots.txt 的 robots.txt 页面会包含:
- User-agent: *
- Disallow: /aponline/
- Disallow: /archives/
- Disallow: /reuters/
因此,《纽约时报》网站中包含这些文件夹及其他任何相似的文件夹的URL的存档请求就被排除在外。
《华盛顿邮报》的 http://www.washingtonpost.com/robots.txt 包含:
- User-agent: ia_archiver
- Disallow: /
这一指令直接阻止互联网档案馆访问全站。
Javascript小书签
[编辑]在您的浏览器中,当你进入一个网页的失效链接,并查询 archive.org 的存档,将下列代码加为书签,加上诸如Wayback的名称(如 Wayback):
- javascript:void(window.open('https://web.archive.org/web/*/'+location.href));
然后,如果某个页面失效,你可以点击此书签,并且会被自动带入 Wayback Machine 的存档记录页面。
如果上述书签对您无效,还可以使用下列书签:
- javascript:location.href='https://web.archive.org/web/*/'+document.location.href;
您还可以尝试把一个网页存为 archive.org 的存档,将下列代码加为书签,加上诸如Wayback 存档的名称(如 Wayback 存档):
- javascript:void(window.open('https://web.archive.org/save/'+location.href));
浏览器扩展
[编辑]如果您使用Mozilla Firefox,您可以添加Save To The Wayback Machine扩展,这将会增加右键进行查询、保存网页的功能,并提供一个与上述内容相似的按钮。
如果您使用Chrome或其他基于Chromium进行定制的网页浏览器,您可以添加互联网档案馆(archive.org)开发的Wayback Machine扩展。
使用Webarchive模板
[编辑]{{webarchive}}可用于增加网页存档站点的链接。使用 |url=
、|title=
与 |date=
参数以定义URL、标题与日期。
基本示例:
{{webarchive |url=https://web.archive.org/web/20010727112808/http://www.wikipedia.org/ |date=2001-07-27 |title=Wikipedia }}
→ Wikipedia,存档于互联网档案馆(存档日期 2001-07-27)
可以不包含日期:
{{webarchive |url=https://web.archive.org/web/*/http://www.wikipedia.org/ |date=* |title=Wikipedia }}
→ Wikipedia,存档于互联网档案馆(存档 index)
请注意日期参数默认为 *
用于引用模板
[编辑]{{citation}}其他引文格式1模板支持|archiveurl=
参数(注意|archivedate=
参数也需要使用)。其他引用模板还会支持|archiveurl=
——参见这些模板的子页面。
- {{citation
|url=http://www.wikipedia.org/
|title=Wikipedia Main Page
|archiveurl=//web.archive.org/web/20020930123525/http://www.wikipedia.org/
|archivedate=2002-09-30
|accessdate=2005-07-06
}}
→ Wikipedia Main Page. [2005-07-06]. (原始内容存档于2002-09-30). - 在存档资源记录有原始发布日期时,使用
|date=
代替|accessdate=
。 - 当给任何一个在原始URL仍在使用的引文添加一个存档URL的时候,可以添加
|deadurl=no
参数。
参见
[编辑]- {{dead link}},标记失效链接
- {{user archiveurl}},用户框
- {{user Internet Archive}},用户框
- {{user web archive}},用户框
- {{Webarchive}},模板:Webarchive
- Wikipedia:失效链接,防止链接失效的方法
- Wikipedia:使用WebCite,使用非传统的WebCite存盘服务的指引