开源应用:30小时下载全部维基百科内容

开源
有这么一款开源应用程序,它可以帮助您用30多个小时时间内自动将所有的维基百科下载到你的电脑里。

11月29日消息:有这么一款开源应用程序,它可以帮助您用30多个小时时间内自动将所有的维基百科下载到你的电脑里。这个程序就是Xowa,软件可以离线显示440多万维基百科文章,并且完整保存HTML格式不变。

[[90808]]

维基百科

用户也可以设置额外的wiki,像Wiktionary或者Wikiquote,并且支持离线查询。例如,在离线的时候,用户可以点击Wikitionary,并立即查看Wikitionary页面。Xowa已经存在了一段时间,原来只支持维基百科简单的操作。昨天刚刚完成升级,支持全部英文版本维基百科。

英文版维基百科有大量数据,有1390万页内容,txt文档就超过20GB以及370张图片。设置下载这些东西不是一个很简单的过程,需要80GB空间以及5个小时左右的处理时间,如果想要下载图片,存储空间需要100GB,下载时间也会增加到30多个小时。当下载完成之后,用户会拥有一个完整的、几乎和英文版维基百科一模一样的副本。这些也可以安装到128GB的SD卡中。

尽管安装期间至少需要80GB硬盘空间,安装之后,可以删除45GB临时文件,清理之后wiki文件最终会减少到25GB左右。除了维基百科数据转储以及来自维基媒体基金会,Xowa主要由XUL运行,Firefox运行环境;JAVA和SWT以及标准窗口小部件工具箱组成。

如果你想下载,但是又不想花费一整天,Xowa开发者建议从简版维基百科开始。简版维基百科有184000页以及90000张图片。文本内容需要200MB空间,5分钟就可以搞定。如果需要下载图片,也仅仅需要2GB空间,30分钟。简版维基百科可以相当准确的模拟Wikepedia,而且相当小。

责任编辑:奔跑的冰淇淋 来源: 中关村在线
相关推荐

2013-10-30 16:54:46

维基百科维基百科的衰落

2010-07-06 09:06:54

维基百科数据中心断电宕机

2013-04-25 09:53:52

MariaDB

2012-08-08 09:50:58

2017-06-03 16:08:09

HTTPS互联网维基

2013-09-17 09:49:38

大数据NoSQLMariaDB

2021-08-03 14:01:53

Vue.js维基百科框架

2020-07-19 10:30:56

AI 数据人工智能

2009-11-19 09:22:08

互联网10年10大重要

2012-02-10 09:51:13

Java

2017-10-26 14:29:50

互动百科

2015-05-25 14:19:48

互动百科

2013-04-25 10:43:33

维基百科MySQLMariaDB

2017-06-20 10:51:15

芒果

2017-02-09 17:05:03

2009-09-18 09:36:56

2012-12-19 13:06:31

MySQL

2022-12-01 13:10:13

SASE网络

2014-08-11 11:19:53

Java虚拟机Java

2018-06-29 17:05:51

互动百科
点赞
收藏

51CTO技术栈公众号