Python继续引领机器学习,人工智能,深度学习和数据科学任务。据builtwith.com称,45%的技术公司更喜欢使用Python来实现AI和机器学习。
因此,我们决定开始研究几个类别的顶级Python库:
十大Python数据科学库 - 这篇文章
Top X Python强化学习和进化计算库 - 即将推出!
当然,这些列表完全是主观的,因为许多库可以轻松地放在多个类别中。与往常一样,请随时在下面的评论部分发泄您的挫折/分歧/烦恼!
GitHub贡献者,提交者和大小(圈子的大小)排名前10位Python数据科学库
现在,让我们进入列表(GitHub数字在2018年11月16日更正):
1. pandas(贡献者 - 1328,提交 - 18162,Stars - 16890)
“ pandas 是一个Python包,提供快速,灵活和富有表现力的数据结构,旨在使”关系“或”标记“数据的使用既简单又直观。它旨在成为用Python 进行实际,真实数据分析的基础高级构建块 。“
2. Matplotlib(贡献者 - 771,提交 - 27937,Stars - 8224)
“Matplotlib是一个Python 2D绘图库,可以生成各种硬拷贝格式和跨平台交互式环境的出版品质数据。Matplotlib可用于Python脚本,Python和IPython shell(例如MATLAB或Mathematica),Web应用程序服务器和各种图形用户界面工具包。“
3. NumPy(贡献者 - 708,提交 - 19241,明星 - 8666)
“NumPy是使用Python进行科学计算所需的基础包。它提供了强大的N维数组对象,复杂(广播)功能,集成C / C ++和Fortran代码的工具以及有用的线性代数,傅里叶变换和随机数功能。
4. SciPy(贡献者 - 670,提交 - 20080,明星 - 5096)
“SciPy(发音为”Sigh Pie“)是数学,科学和工程的开源软件。它包括统计,优化,集成,线性代数,傅立叶变换,信号和图像处理,ODE求解器等模块。“
5. Bokeh(贡献者 - 325,提交 - 17365,明星 - 8439)
“Bokeh是一个用于Python的交互式可视化库,可以在现代Web浏览器中实现美观且有意义的数据视觉呈现。使用Bokeh,您可以快速轻松地创建交互式图表,仪表板和数据应用程序。“
6. Gensim(贡献者 - 299,提交 - 3676,明星 - 8107)
“Gensim是一个用于主题建模, 文档索引 和 大型语料库相似性检索的Python库 。目标受众是 自然语言处理 (NLP)和 信息检索 (IR)社区。“
7. Scrapy(贡献者 - 295,提交 - 6802,Stars - 30014)
“Scrapy是一种快速的高级Web爬行和Web抓取框架,用于抓取网站并从其页面中提取结构化数据。它可用于各种用途,从数据挖掘到监控和自动化测试。“
8. StatsModels(贡献者 - 164,提交 - 10896,Stars - 3383)
“Statsmodels是一个Python包,为统计计算的scipy提供补充,包括描述性统计和统计模型的估计和推断。”
9. plotly.ly(贡献者 - 62,提交 - 3291,星 - 4218)
“plotly.ly是一个用于Python的交互式,开源和基于浏览器的图形库。plotly.py建立在 plotly.js之上,是一个高级的声明性图表库。plotly.js附带超过30种图表类型,包括科学图表,3D图表,统计图表,SVG地图,金融图表等。“
10. pydot(贡献者 - 12,提交 - 169,明星 - 267)
“pydot是Graphviz的一个接口,可以解析并转储到Graphviz使用的DOT语言中,并且是用纯Python编写的。”
请密切关注本系列的最后部分 - 重点是强化学习和进化计算库 - 将在未来几周内发布!
评论专区