GitHub上最全中华古诗词数据库又火了

新闻 前端
近期,GitHub 上最全中华古诗词数据库再次登上热榜,又火了一把。

 近期,GitHub 上最全中华古诗词数据库再次登上热榜,又火了一把。根据介绍,chinese-poetry 最全中华古诗词数据库集合了唐宋两朝近一万四千古诗人, 接近 5.5 万首唐诗加 26 万宋诗. 两宋时期 1564 位词人,21050 首词。该项目已经获得了 22.6k 个「star」以及 4.2k 个「fork」。

  GitHub 项目:https://github.com/chinese-poetry/chinese-poetry

  最全的中华古典文集数据库,包含 5.5 万首唐诗、26 万首宋诗、2.1 万首宋词和其他古典文集。诗人包括唐宋两朝近 1.4 万古诗人,和两宋时期 1.5 千古词人。数据来源于互联网。

  为什么要做这个仓库? 项目作者表示,古诗是中华民族乃至全世界的瑰宝,我们应该传承下去,虽然有古典文集,但大多数人并没有拥有这些书籍。从某种意义上来说,这些庞大的文集离我们是有一定距离的。而电子版方便拷贝,所以此开源数据库诞生了。此数据库通过 JSON 格式分发,可以让你很方便的开始你的项目。

  古诗采集没有记录过程,因为古诗数据庞大,目标网站有限制,采集过程经常中断超过了一个星期。2017 年新加入全宋词,全宋词爬取过程及数据分析。

  高频词分析图

  宋词受欢迎的词牌名

  宋词高频词

  宋词作者作品榜

  唐诗高频词

  唐诗作者作品榜

  宋诗高频词

  宋诗作者作品榜

  数据集

 

责任编辑:张燕妮 来源: IT之家
相关推荐

2021-07-20 09:58:16

鸿蒙HarmonyOS应用

2020-01-06 10:32:17

JavaScript开源Github

2020-08-24 10:20:38

微软开源GitHub

2021-08-26 23:12:31

云计算边缘计算服务器

2023-12-04 09:14:00

数据库MySQL

2022-04-21 10:14:02

Yandex开源数据库

2020-04-14 10:50:47

FlutterGithub

2011-05-16 10:46:29

Facebook

2020-06-23 09:35:13

分布式数据库网络

2014-02-19 13:30:05

运维安全数据库

2022-09-05 15:12:34

数据库GitHub开发

2021-01-06 16:30:55

SQL数据库安全

2011-03-08 08:49:55

MySQL优化单机

2014-04-18 15:26:33

Oracle Exad数据库云时代

2010-08-03 14:40:05

DB2数据库

2024-02-21 14:07:00

2022-03-25 09:04:01

Mysql数据库

2024-08-21 15:17:06

2017-07-12 08:33:04

机房数据中心服务器
点赞
收藏

51CTO技术栈公众号