Python语言作为现如今一大主流语言,拥有着入门简单,功能强大,语言表达优美,代码开发效率高,是多个大厂开源机器学习框架语言。作为处在互联网时代的我们,不管是想要入IT行业的新手小啰啰、Linux系统运维人员、数据分析师或者是在职想要转python的程序员们都在使用这种语言,可是,你们了解python库吗?你收藏了多少呢?这次将给大家分享我和同事们的压箱宝贝,都是一些非常独特且使用起来的很有趣的python包。
用于数据可视化的Python库
- Matplotlib-是Python中最流行的数据可视化库,Python 2D 绘图库
- Seaborn-一个基于matplotlib的绘图库
- Bokeh-一个面向现代网页浏览器的交互式可视化库
- plotly – 协同 Python 和 matplotlib 工作的 web 绘图库。
数据清理和操作
- ftfy:修复mojibake和Unicode文本中的其他故障。
- janitor:有很多很酷的功能来清理数据。
- Optimus:另一个数据清理包。
- Great-experctations:一个检查数据是否符合预期的好工具。
数据探索和建模
- Pandas-profile:创建一个包含来自pandas Data Frame的统计数据的HTML报告。
- dabl:允许使用可视化和预处理进行数据探索。
- pydqc:允许比较两个数据集之间的统计数据。
- pandas-summary:对panda Data Frames描述功能的扩展。
- pivottable-js:pands在jupyter notebook的拖放功能。
数据结构
- Bounter:有效的计数器,使用有限(有界)的数量的内存,无论数据大小。
- Python -bloomfilter:可扩展的Bloom Filter,使用Python实现。
- datasketch:提供概率数据结构,如LSH、加权Min Hash、Hyper LogLog等。
- ranges:Python的连续范围、范围集和范围令数据结构
性能检查和优化
- Py-spy: Python程序的采样分析器。
- pyperf:用于运行Python基准测试的工具箱。
- snakeviz:一个浏览器内的Python配置文件查看器,对jupyter notebook有很大的支持。
- Cachier: Python函数的持久、无延迟、本地和跨机缓存。
- Faiss:用于高效的相似性搜索和密集向量聚类的库。
以上就是这次的分享内容,当然这只是我们自己总结出来的比较优秀的,欢迎持续关注编程学习网
扫码二维码 获取免费视频学习资料
- 本文固定链接: http://phpxs.com/post/8575/
- 转载请注明:转载必须在正文中标注并保留原文链接
- 扫码: 扫上方二维码获取免费视频资料
查 看2022高级编程视频教程免费获取