今天给大家推荐的开源项目是:twint,Twint是使用Python编写的高级Twitter抓取和OSINT工具,不使用Twitter的API,可让你在逃避大多数API限制的同时抓取用户的关注者,推文等。
Twint是使用Python编写的高级Twitter抓取工具,无需使用Twitter的API,即可从Twitter资料中抓取Tweet 。Twint利用Twitter的搜索运算符,可让您从特定用户处抓取Tweets,抓取与某些主题,主题标签和趋势有关的Tweets或从Tweet中筛选敏感信息,例如电子邮件和电话号码。我觉得这很有用,您也可以从中真正发挥创意。
Twint还会对Twitter进行特殊查询,使您也可以在没有任何身份验证,API,Selenium或浏览器仿真的情况下,抓取Twitter用户的关注者,用户喜欢的Tweets以及他们关注的对象。
效果展示
安装
Git:
git clone https://github.com/twintproject/twint.git
cd twint
pip3 install . -r requirements.txt
Pip:
pip3 install twint
or
pip3 install --user --upgrade git+https://github.com/twintproject/twint.git@origin/master#egg=twint
Pipenv:
pipenv install git+https://github.com/twintproject/twint.git#egg=twint
Requirements
Python 3.6;
aiohttp;
aiodns;
beautifulsoup4;
cchardet;
elasticsearch;
pysocks;
pandas (>=0.23.0);
aiohttp_socks;
schedule;
geopy;
fake-useragent;
py-googletransx.
以上就是“python爬取推特的详细教程(Python编写Twitter工具)”的详细内容,想要了解更多Python教程欢迎持续关注编程学习网。
扫码二维码 获取免费视频学习资料
- 本文固定链接: http://phpxs.com/post/10996/
- 转载请注明:转载必须在正文中标注并保留原文链接
- 扫码: 扫上方二维码获取免费视频资料
查 看2022高级编程视频教程免费获取