2025
07-11
07-11
用 Python 自动化将 PDF 中的图片、表格、文本“一锅端”并分类存储!
在日常办公中,PDF 文档既是资料分享的常见格式,也常常让人“提取素材”寸步难行:手动截屏、复制表格、OCR 文字……重复操作耗时又易出错。今天,教你用 Python 自动化脚本,一次性将 PDF 中的 图片、表格、文本 分离,分别存成独立文件夹,解放双手!
继续阅读 >
PHP 代码分享
MongoDB 教程
正则表达式
jQuery 教程
JavaScript 代码片段
PHP7 教程
在日常办公中,PDF 文档既是资料分享的常见格式,也常常让人“提取素材”寸步难行:手动截屏、复制表格、OCR 文字……重复操作耗时又易出错。今天,教你用 Python 自动化脚本,一次性将 PDF 中的 图片、表格、文本 分离,分别存成独立文件夹,解放双手!
继续阅读 >
还记得刚入行那会儿 我拿到一个Excel表格里的销售数据 足足有十万条记录。领导让我分析一下各地区的销售趋势。当时的我 还在用Excel一行行地筛选排序 累得要死不说 电脑还卡得要命。同事看不下去了 说你试试Pandas吧。那一刻 我的数据分析人生彻底改变了。
继续阅读 >
说实话,我以前是个“硬核”程序员,啥都爱自己从头写。JSON转CSV?“小意思,我来搞定!”命令行仪表盘?“给我30分钟和Vim就行!”但时间久了,我发现虽然手写代码有种“治愈感”(还有点小骄傲),但这往往不是最聪明的选择——尤其是当别人已经把重活干了、测试了各种边界情况,还封装了优雅的API。
继续阅读 >
@contextmanager 装饰器能减少创建上下文管理器的样板代码量,因 为不用编写一个完整的类,定义 __enter__ 和 __exit__ 方法,而只 需实现有一个 yield 语句的生成器,生成想让 __enter__ 方法返回的 值。
继续阅读 >
AI智能体通常是大语言模型(LLM)。它们的工作模式构成一个反馈循环:LLM作出决策,系统执行动作并收集外部反馈,再交由LLM评估,以决定任务是已完成还是需要进入下一环。本期我们将介绍目前最热门的7个Python智能体框架。
继续阅读 >
Python里想动态操作对象的属性,这事儿说难也难,说简单也简单。关键就看你是不是站在“写框架”还是“调 API”的角度来看。今天咱就聊聊这个问题,说清楚getattr、setattr这些魔法方法到底在实际开发中是怎么用的,背后有什么坑,哪些是救命稻草,哪些是祖传坑。
继续阅读 >
说到 Python 加速这档事啊,真的是每个写代码的人迟早都要头疼一把。尤其是你写了个看起来挺优雅的 Python 算法,结果一跑,哎妈,慢得跟蜗牛爬一样。这时候你就会开始琢磨:能不能不改太多代码,就提提速?于是你会在 Cython、PyPy、CPython、Numba 之间反复横跳,但说实话,这几个家伙各有自己的小脾气,真要选一个“完美解”,基本上是没门儿。
继续阅读 >
在 Python 中,try/except 不仅用于处理错误,还常用于控制流程。为 此,Python 官方词汇表(https://docs.python.org/3/glossary.html#termeafp) 还定义了一个缩略词(口号)。
继续阅读 >
很多人听到“Python”,第一反应是编程太难,或者是AI工程师才用得上。但对搞科研的我们来说,Python并不是为了“转码”而学的一门技术,而是一把工具——一种可以让你更快处理数据、更清晰展示结果、更系统复现实验的科研武器。
继续阅读 >