继推出2017年机器学习开源项目Top 30榜单后,Mybridge AI又推出了一个Python开源项目Top 30榜单,包括开源Python库、工具等。该榜单基于项目质量、用户参与度以及其他几个方面进行了评估,从大约15000个开源项目中挑选了Top 30,差不多都是在2017年1-12月发布。这些项目在Github上的平均star为3707。
No 1:Home-assistant (v0.6+)
基于Python 3的开源家庭自动化平台[Github 11357 stars,由Paulus Schoutsen提供]
https://github.com/home-assistant/home-assistant
No 2:Pytorch
PyTorch是使用GPU和CPU优化的深度学习张量库,基于Python语言编写。[Github 11019 stars,由PyTorch团队的Adam Paszke和其他人提供]
https://github.com/pytorch/pytorch
No 3:Grumpy
Grumpy是一个Python to Go的源代码翻译编译器和运行时,旨在取代CPython 2.7。关键区别在于,Grumpy是将Python源码编译为Go源代码,然后将其编译为native code,而不是bytecode。这也就意味着Grumpy没有虚拟机(VM)。编译好的Go源码是对Grumpy运行时的一系列调用,一个Go库服务于具有相似目的的Python C API。 [Github 8367 stars,由Google的Dylan Trotter及其他工作人员提供]。
https://github.com/google/grumpy
No 4:Sanic
该项目是一个类 Flask 的 Python 3.5+ 网页服务器,专为加速而设计。Sanic支持异步请求处理,意味着你可以使用Python 3.5中一些async/await语法。。[Github 8028 stars,由Channel Cat和Eli Uriegas提供]
https://github.com/channelcat/sanic
No 5:Python-fire
一个可以从任何Python对象自动生成命令行界面(CLI)的库。 [Github 7775 stars,来自Google Brain 的 David Bieber]
https://github.com/channelcat/sanic
No 6:spaCy(v2.0)
该项目是一个使用Python和Cython的进行高级自然语言处理(NLP)的开源库 [Github 7633 stars,由Matthew Honnibal提供]
https://github.com/explosion/spaCy
No 7:Pipenv
Python.org官方推荐的Python打包工具。它会自动为项目创建和管理virtualenv,并在安装/卸载软件包时从Pipfile中添加/删除软件包。 [Github 7273 stars,由Kenneth Reitz提供]
https://github.com/pypa/pipenv
No 8:MicroPython
一个脱胎于Python且非常高效的Python实现,主要是为了能在嵌入式硬件上(这里特指微控制器级别)更简单地实现对底层的操作。[Github 5728 stars]
https://github.com/micropython/micropython
No 9:Prophet
该工具是Facebook开源的一款用于为多周期性的线性或非线性时间序列数据生成高质量预测的工具。[Github 4369 stars,由Facebook提供]
https://github.com/facebook/prophet
No 10:Serpent AI
该项目是一个Python写的游戏代理框架,简单而强大,可帮助开发者创建游戏代理。可将任何视频游戏变成一个Python写成的成熟沙箱环境。该框架的目的是为机器学习和AI研究提供一个有价值的工具,不过对于爱好者来说也是非常有趣的。[Github 3411 stars,由Nicholas Brochu提供]
https://github.com/SerpentAI/SerpentAI
No 11:Dash
Dash是一个纯Python写成的框架,无需JavaScript即可构建交互式的分析类web应用程序。[Github 3281 stars,由Chris P提供]
https://github.com/plotly/dash
No 12:InstaPy
Instagram机器人,喜欢/评论/Follow 自动化脚本。[Github 3179 stars,由TimG提供]。
https://github.com/timgrossmann/InstaPy
No 13:Apistar
专为Python 3定制的Web API框架[Github 3024 stars,Tom Christie提供]。
https://github.com/encode/apistar
No 14:Faiss
用于密集向量的高效相似性搜索库和聚类的库 [GitHub 2717 stars,贡献者Facebook Research]
https://github.com/facebookresearch/faiss
No 15:MechanicalSoup
一个与网站自动交互的Python库,自动存储和发送cookies,支持重定向,并可以跟踪链接和提交表格。[Github 2244 stars]
https://github.com/MechanicalSoup/MechanicalSoup
No 16:Better-exceptions
该项目以更友好的形式展示Python中的异常信息。[Github 2121 stars,贡献者Qix]
https://github.com/Qix-/better-exceptions
No 17:Flashtext
该项目基于FlashText算法,用以高效搜索句子中的关键词并进行替代。[Github 2019 stars,由Vikash Singh提供]。
https://github.com/vi3k6i5/flashtext
No 18:Maya
在不同系统上的不同语言环境中,Python对日期时间的处理非常不畅,Maya主要就是为了解决解析网站时间数据问题。[Github 1828 stars,Kenneth Reitz提供]
https://github.com/kennethreitz/maya
No 19:Mimesis
是一个快速易用的Python库,可以用不同语言为基于不同的目的生成合成数据。这些数据在软件开发和测试阶段非常有用。[Github 1732 stars,由LíkieGeimfari提供]
https://github.com/lk-geimfari/mimesis
No 20:Open-paperless
该项目是一个一个文件管理系统,可扫描、索引和归档所有纸张文档。[Github 1717 stars,由Tina Zhou提供]
https://github.com/zhoubear/open-paperless
No 21:Fsociety
黑客工具包,渗透测试框架。[Github 1585 stars,Manis Manisso提供]
No 22:LivePython
Python代码实时可视化跟踪。[Github 1577 stars,由Anastasis Germanidis提供]
https://github.com/agermanidis/livepython
No 23:Hatch
一个Python项目、包以及虚拟环境的管理工具。[Github 1537 stars,由Ofek Lev提供]
https://github.com/ofek/hatch
No 24:Tangent
该项目是谷歌开源的一个用于自动微分的源到源纯Python库。[Github 1433 stars,来自Google Brain的Alex Wiltschko以及其他人]。
https://github.com/google/tangent
No 25:Clairvoyant
一个Python程序,用于识别和监控短期库存移动的历史线索[Github 1159 stars,由Anthony Federico提供]。
https://github.com/anfederico/Clairvoyant
No 26:MonkeyType
该项目是Instagram开源的一款适用于Python的工具,通过收集运行时类型来生成静态类型注释。[Github 1137 stars,由Instagram工程师Carl Meyer提供]。
https://github.com/Instagram/MonkeyType
No 27:Eel
该项目是一个小型Python库,用于制作简单的类似 Electron的离线HTML/JS GUI应用程序,当前仅支持Python3。 [Github 1137 stars]
https://github.com/ChrisKnott/Eel
No 28:Surprise v1.0
用于构建和分析推荐系统的Python scikit [Github 1103 stars]
https://github.com/NicolasHug/Surprise
No 29:Gain
Web爬虫框架。[Github 1009 stars,由高久力提供]
https://github.com/gaojiuli/gain
No 30:PDFTabExtract
一组用于从PDF文件中提取表格的工具,有助于在扫描的文档上进行数据挖掘。 [Github 722 stars]
https://github.com/WZBSocialScienceCenter/pdftabextract
原文地址:https://medium.mybridge.co/30-amazing-python-projects-for-the-past-year-v-2018-9c310b04cdb3