本文我们将和大家介绍 GitHub 上 1 月份最受欢迎的 11 个Python开源项目,在这些项目中,你有在用或用过哪些呢?
1.12306
https://github.com/testerSunshine/12306 Star 6514
12306智能刷票助手,就是程序员自己写的一个抢票脚本,该依赖库的Python版本支持2.7.10 - 2.7.15,其设计思路如下:
2.py12306
https://github.com/pjialin/py12306 Star 3408
这也是一个12306购票助手,支持分布式,多账号,多任务购票以及Web页面管理,支持python 3.6以上版本
3.flair
https://github.com/zalandoresearch/flair Star 4893
Flair是最近开源的一个基于Pytorch的NLP框架,具有以下特性:
一个功能强大的NLP库,Flair允许您将最先进的自然语言处理(NLP)模型应用于您的文本,例如命名实体识别(NER),词性标注(PoS),意义消歧和分类。
单个模型,可用于预测多种文本语言输入的PoS或NER标记。
文本嵌入库,Flair具有简单的界面,允许您使用不同组合的单词和文档嵌入,包括创建者提出的Flair嵌入,BERT嵌入和ELMo嵌入。
Pytorch NLP框架,Flair基于Pytorch上构建,使你可以轻松地训练自己的模型。
4.pkuseg-python
https://github.com/lancopku/pkuseg-python Star 2871
一个领域细分的中文分词工具包,简单易用,支持细分领域分词,有效提升了分词准确度。pkuseg具有如下几个特点:
多领域分词,目前支持了新闻领域,网络文本领域和混合领域的分词预训练模型,后期还会不断新增
更高的分词准确率,相比于其他的分词工具包,当使用相同的训练数据和测试数据,pkuseg可以取得更高的分词准确率。
支持用户自训练模型,支持用户使用全新的标注数据进行训练。
5.howmanypeoplearearound
https://github.com/schollz/howmanypeoplearearound Star 5568
howmanypeoplearearound通过监控wifi信号来计算附近的人数,比如你可以通过它计算目前你在家的人数或者待在宿舍的舍友人数,已经在在Linux(Raspbian和Ubuntu)和Mac OS X上测试过。
6.system-design-primer
https://github.com/donnemartin/system-design-primer Star 56017
该项目是关于如何设计大型系统,以及如何应对系统设计面试。系统设计是一个很宽泛的话题。在互联网上,关于系统设计原则的资源也是多如牛毛。这个仓库就是这些资源的组织收集,它可以帮助你学习如何构建可扩展的系统。
7.awesome-python-applications
https://github.com/mahmoud/awesome-python-applications Star 6230
这是一个Python程序集合,它们不仅可以帮助你快速找到你想要的Python项目,还能作为你日常开发中的借鉴对象,目前包含195个开源Python程序,而且数量还在不断增加,按照主题划分,包含库和文档等链接,其中开发这一部分又被分成了11个模块
8.funNLP
https://github.com/fighting41love/funNLP Star 455
中文NLP词库,涉及内容包括: 中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取等
9.models
https://github.com/tensorflow/models Star 47957
一个Tensorflow库,里面包含使用TensorFlow构建的模型和示例的教程,旨在更好的维护,测试,并与最新的TensorFlow API保持同步最新。
TensorFlow实现模型:https://github.com/tensorflow/models/blob/master/research
TensorFlow教程:
https://github.com/tensorflow/models/blob/master/tutorials
10.awesome-python
https://github.com/vinta/awesome-python Star 60906
这是一个Python程序集合,它们不仅可以帮助你快速找到你想要的Python项目,还能作为你日常开发中的借鉴对象,目前包含195个开源Python程序,而且数量还在不断增加,按照主题划分,包含库和文档等链接,其中开发这一部分又被分成了11个模块
11.CopyTranslator
https://github.com/elliottzheng/CopyTranslator Star 2034
这个开源项目对英语薄弱的开发者来说简直是福音,因为你只需打开CopyTranslator,直接复制PDF文本,CopyTranslator监听到剪贴板变化,会将剪贴板内容进行处理(如去除多余换行等),并显示翻译结果,翻译效果相比于直接复制黏贴到网页版翻译有了巨大的改善,同时翻译所需时间也大大减少。