你听说过「互联网档案馆」吗?

简介:

3c599be332ba2b2622b883771ae9006c42574148

互联网档案馆?不知道有多少人听说过「互联网档案馆」呢?又有多少人知道互联网档案馆存在的意义呢?

其实互联网档案馆(The Internet Archive),从 1996 年就成立了,功能就是:定期收录并永久保存全球网站上可以抓取的信息。

互联网档案馆是由 Alexa 创始人布鲁斯特 · 卡利创办,是一个公益性质的计划,它的中文名可以叫「互联网档案馆」,也可以叫「网站时光倒流机器」。

对于不同的网站,「互联网档案馆」收录的网页数量和收集周期也不相同,一些大型网站可能每天都会被 “备份” 一次,每次可能收录数十个以上的网页,而一些小型网站可能每年收录几次,每次只有几个网页。对网站不同时期的历史资料进行研究,是互联网档案馆最大的价值所在。用户可以通过「互联网档案馆」的 “Take Me Back” 对网站的发展与历史资料进行研究。

互联网档案馆收录计划都包括哪些内容呢?其中有六大模块,分别为:电子书,网页,视频,音频,软件,教育资料。你们知道吗?迄至 2012 年 10 月,其信息储量达到 10 PB。网路爬虫抓取了超过 1500 亿的网页。

电子书

专门收集公共领域的书籍和文档,任何人都可以在上面免费的下载,堪称互联网上最好的公共领域图书搜索引擎。截至 2013 年 7 月,档案馆共收集了 440 万本书,每月的下载量超过 1500 万。 截至 2008 年 11 月,档案馆共有 100 万个网络文本,总大小高达 0.5PB,涵盖了原始照相图像、裁剪和歪斜的图像、PDF 文件和原始 OCR 数据。

网页

上面我们也提到了,网页的收藏,可以说是:「网站时光机」。是互联网档案馆最重要的服务之一。时光机允许人们去搜索和访问其网页存档,即使你自己曾经建立过网站,现在已经不复存在,如何被它收录了,在上面也可以找到你网站的痕迹。可以说,这叫:雁过留声,人过留名

比如:我之前有两个自己的独立博客,一个是 loonggg.com ,一个是 godcoder.me ,而 loonggg.com 这个独立博客已经好久不用了,已经不复存在了,但是我在互联网档案馆里搜了一下,它曾经在 2016 年的时候,有过两次保存我博客的内容。如下:

893ad4e6dfe3bc54345ca34f0639ee04fe4f811d

点击上面保存的两次日期,就可以看到你博客上的内容了。是不是很厉害?这就是价值和意义。

音频和视频

音频它主要收集的是音乐和有声书籍,而视频主要收集的是动画片和电影。你可以尝试着去上面搜一搜一些很难找的动画片和视频,看看有没有被收录,还能不能找到?

软件和教育资料

软件就是收录软件,教育资料就是一些大学的公开课程,有视频和文字资料等。

通过上面的简单介绍,是不是感觉互联网档案馆是个怀旧的好去处?

今天之所以介绍和提到互联网档案馆,是因为最近他们又有了一项新动作。

网站总监 MarkGraham 表示,互联网档案馆收录的内容不断的增长,其中包括超过四百万本书籍和 3390 亿个网页。但是最近该网站又推出了 Commodore 64 模拟器,理论上里面的每个软件(包括几款经典游戏)都经过了广泛的测试,可以像往年一样正常工作。

fd60301d3d0c43c1ce89faffc24a9b18a7cb01c0

如果你想加载一个喜欢的 Commodore 64 程序,只需在互联网档案馆的库中查找并点击,即可瞬间穿越时光,重温 Commodore 64 上的 10500 个程序。当然,这个数字在将来还会继续的增加。

我们简单截图,看一下:

7f2aafeed5c514d87577e3640ceaaf716bb05496

上面随便一个游戏,你点击进去,就都可以玩了。是不是一个怀旧的好去处呢?

地址:https://archive.org/details/softwarelibrary_c64

科普:

Commodore 64,也称为 C64、CBM 64 或在瑞典被称作 VIC-64,是由 Commodore(康懋达国际)公司于 1982 年 1 月推出的 8 位家用电脑。Commodore 64 也是吉尼斯世界记录上销量最高的单一电脑型号。Commodore 64 因其 64 千字节(65,536 字节)的存储器命名,是一段个人计算机历史的见证。完整的机器带有 1541 单软盘驱动器,一个 C2N 盒式磁带机,一个键盘和 7 张软件盘。

互联网档案馆的地址,传送门:

https://archive.org/

赶紧去查查,你的东西有没有被收录吧?


原文发布时间为:2018-10-21 本文作者: loonggg  本文来自云栖社区合作伙伴“非著名程序员”,了解相关信息可以关注“非著名程序员”。


相关文章
|
C语言
小白的崛起之路——每日一记
如果arr[mid]是小于key,那说明key还在右边这时数据范围就缩小到[mid+1,right],(mid为什么要加一呢?因为mid所占的数据不符所以要加一缩小范围)。也就是把mid+1的值赋给了left;然后再算出mid值进行查找,如果下一次arr[mid]==key 那恭喜找到了,否则继续进行以上操作,也就可以放进一个循环中,当[left,right]区间不断缩小里面的元素也就不断减小,直到元素没有为止循环停止。这时如果left大于right说明这个序列中没有想要找的元素key。
78 0
|
存储 弹性计算 分布式计算
科普达人丨一文弄懂什么是云计算?
云计算的定义、分类,以及发展历程。
科普达人丨一文弄懂什么是云计算?
|
云计算
云计算菜鸟感想
经过一周多的云主机实践学习,表达一下我的使用体验感受,顺便为以后的学习实践续费。
写给企业家:“互联网+”和“+互联网”的区别到底是什么?
写给企业家:“互联网+”和“+互联网”的区别到底是什么?
210 0
写给企业家:“互联网+”和“+互联网”的区别到底是什么?
|
大数据 虚拟化
又到世界读书日:给互联网从业者推荐的6本书
又到世界读书日:给互联网从业者推荐的6本书
251 0
又到世界读书日:给互联网从业者推荐的6本书
|
开发框架 JavaScript 小程序
写给喜欢互联网技术的机械类学生
【来信】   贺老师您好,我是一名来自XX大学的即将大二的学生,从初中开始就一直对计算机编程有很大的兴趣,初中的时候学习了asp与vb也编写过一些小程序,中间也黑过很多企业的网站,到高中的时候又迷恋上php。
1283 0