Python继续引领机器学习,人工智能,深度学习和数据科学任务。据builtwith.com称,45%的技术公司更喜欢使用Python来实现AI和机器学习。
因此,我们决定开始研究几个类别的顶级Python库:
八大Python机器学习库✅
Top X Python AI库 - 即将推出!
Top X Python深度学习库 - 即将推出!
Top X Python数据科学库 - 即将推出!
当然,这些列表完全是主观的,因为许多库可以轻松地放在多个类别中。例如,Keras包含在此列表中,但TensorFlow已被省略,而深度学习库集合中的功能则被替换。这是因为Keras更像是像SKLearn这样的“最终用户”库,而不是TensorFlow,后者更吸引研究人员和机器学习工程师类型。
与往常一样,请随时在下面的评论部分发泄您的挫折/分歧/烦恼!
GitHub贡献者,明星和提交者的8大Python机器学习库(圈子的大小)
现在,让我们到列表(GitHub的数字,因为10月3日的正确次,2018):
1. scikit-learn(贡献者 - 1175,提交 - 23301,Stars - 30867)
“scikit-learn是一个基于NumPy,SciPy和matplotlib的机器学习的Python模块。它为数据挖掘和数据分析提供了简单而有效的工具。SKLearn可供所有人使用,并可在各种环境中重复使用。
2. Keras(贡献者 - 726,提交 - 4818,明星 - 34066)
“Keras是一个高级神经网络API,用Python编写,能够在TensorFlow, CNTK或 Theano之上运行 。它的开发重点是实现快速实验。 能够以最小的延迟从想法走向结果是进行良好研究的关键。“
3. XGBoost(贡献者 - 319,提交 - 3454,明星 - 13630)
“XGBoost是一款优化的分布式梯度增强库,旨在实现 高效, 灵活 和 便携。它在Gradient Boosting 框架下实现机器学习算法 。XGBoost提供了并行树提升(也称为GBDT,GBM),可以快速准确地解决许多数据科学问题。相同的代码在主要的分布式环境(Hadoop,SGE,MPI)上运行,并且可以解决数十亿个示例之外的问题。“
4. StatsModels(贡献者 - 162,提交 - 10837,星 - 3275)
“Statsmodels是一个Python包,为统计计算的scipy提供补充,包括描述性统计和统计模型的估计和推断。”
5. LightGBM(贡献者 - 91,提交 - 1272,明星 - 6736)
“基于决策树算法的快速,分布式,高性能梯度增强(GBDT,GBRT,GBM或MART)框架,用于排名,分类和许多其他机器学习任务。它属于微软DMTK(http://github.com/microsoft/dmtk)项目的保护范围。“
6. CatBoost(贡献者 - 77,提交 - 3304,星 - 3241)
“CatBoost是一种基于梯度提升 决策树的机器学习方法 。CatBoost的一些主要优点是:与其他GBDT库相比具有卓越的品质,一流的推理速度,支持数字和分类功能以及数据可视化工具。“
7. PyBrain(贡献者 - 32,提交 - 992,星 - 2598)
“PyBrain是一个用于Python的模块化机器学习库。它的目标是为机器学习任务和各种预定义环境提供灵活,易用且功能强大的算法,以测试和比较您的算法。“
8. Eli5(Contibutors - 6,Commits - 929,Stars - 932)
“ELI5是一个Python包,它有助于调试机器学习分类器并解释它们的预测。它支持以下框架和软件包:scikit-learn,XGBoost,LightGBM,lightning和sklearn-crfsuite。“
评论专区