首页 > 网络程序 > CHINESE-POETRY: 最全中文诗歌古典文集数据库
时间:2020-11-9 作者:bokewo 分类: 网络程序
Chinese-poetry 可能是全网最全中文是个古典文集数据库了,目前托管在 GitHub 上,数据是 json 格式,方便进行版本管理。该项目截止目前为止收集了互联网上 5.5 万首唐诗、26 万首宋诗和2.1 万首宋词. 唐宋两朝近 1.4 万古诗人, 和两宋时期 1.5K 词人。该仓库贡献最多的是来自 Teambition 的 JackeyGao 和另一位 Python、Java 开发者 animalize。
该仓库收集的数据集合罗列如下:
计划要收集的是:
目前作者对数据集做了一些数据分析,挖掘出了一些有趣的统计数据。
作者已经在 README 中例举了几个利用该数据库自动生成古诗词的机器学习项目和几个古诗词鉴赏的项目。
因为该仓库是 MIT 许可,有想法的小伙伴可以利用这个数据库作出不少好玩的应用。
推荐阅读:
请遵守《全国人大常委会关于维护互联网安全的决定》及中华人民共和国有关法律法规