

Wayback Machine的目的是复制和存储互联网。自总部位于旧金山的非营利组织Internet Archive于15年前创建该数据库以来,一种名为爬虫的浏览软件已捕获了2亿多个网站的1800亿个网页快照。
现在,Wayback Machine拥有四拍字节的数据,每月新增35到40太字节,是现存最大的可访问网络存档。输入一个已关闭博客的URL,您将看到一个爬取日期的时间轴,其中大部分链接到当日网站的功能性版本。Wayback Machine是免费的,因此任何好奇的浏览器都可以使用这些数据进行历史研究或研究互联网的演变。例如,美国国会图书馆的研究人员使用Wayback Machine收集了2001年9月11日以及之后三个月内网站的画廊。