这些年自己常用的Python库(不计numpy这一类特别常用的库)和各种渠道看到的值得收藏(主观)的推荐。加粗的是我自己常用的,仅供参考。
一、数据可视化1 绘图
PyGWalker
简化Jupyter中的数据探索,将pandas dataframe (polars dataframe) 转换为Tableau风格的可视化界面。
Lux
https://github.com/lux-org/lux
数据集自动可视化库;通过在 Jupyter 笔记本中打印数据框,Lux 推荐一组可视化图表,显示数据集中有趣的趋势和模式。
cufflinks
plotly的封装,一个绘图命令(dataFrame.iplot)实现几乎所有类型的交互式可视化
Altair
建立在 Vega-Lite基础上,低代码生成美观的可视化图。
Pandas_Alive
低代码绘制动态图
pyecharts
基于百度ECharts的交互可视化库
Plotly_express
交互式可视化库plotly的简化接口,类似plotly.express
bokeh
交互式可视化库,支持Web
HoloViews
低代码绘图库,旨在使数据分析和可视化无缝且简单。
sweetviz两行代码实现数据集可视化、分析与比较(EDA).
plotnine
使用方式与R语言很相似,做出来的图也很好看
Pygal
基于XML,可生成高分辨率Web图形页面
scikit-plot
机器学习绘图库
matplotx
Matplotlib的优质扩展,可辅助Matplotlib实现理想图形。
lets-plot
python版的ggplot2
2 绘图风格
mplcyberpunk
为matplotlib绘图添加赛博朋克风格
两个主要功能:make_lines_glow(线条发光)、add_underglow(线条面积图)
SciencePlots
Matplotlib补充包,一键调用符合IEEE等不同期刊要求的图表格式
3 Web交互式可视化(与1的分类存在一定的模糊;包括轻量级WEB)
Gleam
构建数据交互式 Web 可视化:无需 HTML 、JS (灵感来自R 中的Shiny包)
Dash
Dash 抽象出了构建具有交互式数据可视化功能的全栈 Web 应用程序所需的所有技术和协议,是构建数据可视化app的理想选择。
mpld3
通过一个简单的API,将matplotlib图形导出为HTML代码,这些HTML代码可以在浏览器内使用。
Streamlit
用于创建交互式,美观的可视化应用程序(例如机器学习app)
PySimpleGUI
简便,十几行代码可创建各种跨平台GUI、几分钟时间制作图形可视化界面。
Remi
快速构建交互式网页(纯python实现、极简、功能有限)(GUI库)
4 特定功能(主要是机器学习相关)
ann-visualizer
一键导出keras神经网络结构可视化图
3b1b
制作动态3d数学(主要)教程
dash-bio
基于dash构建的的生物信息学可视化库
hiplot
高维数据(例如例如深度学习的调参结果)可视化库
VisualDL
深度学习(指标等)可视化分析
Model Log
基于 Python的深度学习模型训练评估指标可视化工具,与 TensorFlow、Pytorch、PaddlePaddle结合使用,可以记录模型训练过程当中的超参数、Loss、Accuracy、Precision、F1值等,并以曲线图的形式进行展现对比,轻松三步即可实现。
Aim
号称搜索速度比TensorBoard快几倍的机器学习可视化工具包(加州伯克利)
nn_vis
神经网络3D可视化;其他神经网络可视化:NNSVG、Conx、ENNUI、Neataptic
yellowbrick
Scikit-Learn的强力扩展,快速选择机器学习模型和调参。
二、机器学习、深度学习
1 自动机器学习
AutoGL
清华开源自动图机器学习(含深度学习)库
PyCaret
机器学习建模神器,一次可运行多个模型,易于比较。
model_search
自动机器学习模型搜索框架,多个AutoML算法自动出所需AI模型,选出最好的模型。
Auto-sklearn
基于 scikit-learn 软件包构建的开源 AutoML 库 更多(不展开): AutoX、FLAML 、TPOT、Auto-ViML、H2O AutoML、Auto-Keras、Hyperopt Sklearn、AutoGluon、Auto-TS 等
2 可解释性
shap
解释机器学习模型(可视化)(强烈推荐);简单易用,但计算开销极大。
LIME
shap的升级版,机器学习模型解释工具
Shapash
模型可解释性(似乎比shap出图更好看)
3 深度学习
pytorchlighting+PyTorch
Lightningpytorch的高级封装
ENAS-pytorch
神经网络架构搜索
PyTorch-OpCounter
PyTorch小工具 两行代码统计模型参数量与FLOPs
pytorch-summary
pytorch参数统计
TorchMetrics
PyTorch的指标度量库
PyTea
自动检测 PyTorch 项目中的张量shape错误(不执行代码)。
Composer
PyTorch 库,部署了 20 几种加速方法,只需几行代码就能应用。
4 追踪、调参(与3有重叠)
fitlog
复旦邱锡鹏老师组开发的调参利器fitlog(框架无关)
Optuna
调参神器,用于神经网络和树模型。
Deepchecks
Testing Machine Learning Models | Deepchecks几行代码验证机器学习模型
5 其他
hummingbird
将传统机器学习模型编译成张量计算(可以用深度学习框架+cuda加速)
Ydata-quality
数据质量诊断
LOFO
GM自研特征重要性工具包
Traingenerator
为机器学习生成模板代码的 Web 应用
三、资源监测、调试
Heartrate
实时动态监测Python程序的运行
scalene
记录程序每一个模块的耗时
PrettyErrors
import到python文件,即可将报错信息变得极美观、易读
Cyberbrain
回溯变量更改;查看程序执行的每个状态,包括变量的值;调试循环
以上就是“知乎高赞,哪些 Python 库让你相见恨晚?”的详细内容,想要了解更多Python教程欢迎持续关注编程学习网。
扫码二维码 获取免费视频学习资料
- 本文固定链接: http://www.phpxs.com/post/12531/
- 转载请注明:转载必须在正文中标注并保留原文链接
- 扫码: 扫上方二维码获取免费视频资料
查 看2022高级编程视频教程免费获取