清华大佬耗费三个月吐血整理的几百G的资源,免费分享!....>>>
#coding=utf-8 from selenium import webdriver import time browser = webdriver.Firefox() # 启动Firefox浏览器 url1 = 'http://www.baidu.com/s?wd=马尔代夫' # 马尔代夫的百度搜索页 url2 = 'http://scrapy.org/' # 测试页面1 url3 = 'http://news.yahoo.com/air-strike-libyan-city-misrata-clashes-near-oil-135039996.html' # 测试页面2 browser.get(url1) # 打开页面 browser.maximize_window() # 浏览器窗口最大化 res = browser.find_elements_by_xpath("//h3[@class='t c-gap-bottom-small']") # 使用xpath查找页面中的h3元素 for r in res: # 页面中h3元素有多个,所以需要遍历 t = r.find_element_by_xpath("a") # h3元素下的a标签 print '%s - %s' % (t.text, type(t.text)) # 打印a标签的标题以及文本格式 if u'途牛' in t.text: # 判断标题中是否有途牛,如果有则点击 print 'yes' # 判断结果 t.click() # 点击这个a链接 print len(res) # 打印h3标签的总量