Selenium官方網(wǎng)站
http://selenium-python./
配置使用環(huán)境
下載相應(yīng)的瀏覽器驅(qū)動, Firefox 是默認(rèn)的 本文以 chrome 為主 ,放在scripts目錄下 ChromeDriver 官方下載地址 : 所有版本的 ChromeDriver
文檔參考
簡明 Python 教程
Python教程 - 廖雪峰
官方文檔 : Selenium with Python
webdriver實(shí)用指南python版本
一份簡單的測試 demo
1 #coding=utf-8
2 from selenium import webdriver
3 import os
4 import time
5 # set little time stop and big time stop for viewing changes
6 little_time_stop = 1
7 big_time_stop = 2
8 # 默認(rèn)廣告條數(shù)
9 ads_num_require = 8
10 # 請求連接
11 req_url = "http://www.haosou.com/s?ie=utf-8&shb=1&src=360sou_newhome&q=%E9%B2%9C%E8%8A%B1"
12 # 打開瀏覽器
13
14 browser = webdriver.Chrome()
15 # 開始請求
16 17 browser.get(req_url)
17 # 獲取所有的廣告
18
19 all_ads_li = browser.find_elements_by_css_selector('#e_idea_pp li')
20 # 當(dāng)前廣告條數(shù)
21 ads_num_current = len(all_ads_li)
22 print "Has been got %d ads" %(ads_num_current)
23 # 如果廣告條數(shù)與默認(rèn)不符
24 if ads_num_current < ads_num_require:
25 print "The number of ads is not enough ( current : %d require: %d)" %(ads_num_current,ads_num_require)
26 # exit()
27 # 獲取頂部連接
28 i = 0
29 for ads_li in all_ads_li:
30 time.sleep(big_time_stop)
31 i = i+1
32 print "ads %d :" %i
33 try:
34 main = ads_li.find_element_by_css_selector('h3 a')
35 except:
36 print "\tError: ads %d cann't find" %(i)
37 else:
38 print "\tReady: visit ads %d" %(i)
39 main.click()
40 print "\tSucess: visit ads %d" %(i)
41 time.sleep(little_time_stop)
42 try:
43 img_link = ads_li.find_element_by_class_name('e_biyi_img')
44 except:
45 print "\tError : no img in ads %d " %(i)
46 else:
47 print "\tReady : visit img_link %d" %(i)
48 img_link.click()
49 print "\tSuccess : visit img_link %d" %(i)
50 time.sleep(little_time_stop)
51 try:
52 child_div = ads_li.find_element_by_class_name('e_biyi_childLink');
53 except:
54 print "\tError : no child link in ads %d" %(i)
55 else:
56 try:
57 child_links = child_div.find_elements_by_css_selector('a')
58 except:
59 print "\tError : find child_links error"
60 else:
61 num_links = len(child_links)
62 print "\tSuccess : there are %d child_links" %(num_links)
63 j = 0
64 for child_a in child_links:
65 j = j + 1
66 print "\t\tReady : visit child link %d in ads %d" %(j, i)
67 child_a.click()
68 print "\t\tSuccess : visit child link %d in ads %d" %(j, i)
69 time.sleep(little_time_stop)
70 print "End and thanks for your using!"
71 # 下面代碼選擇取消注釋
72 # 延時(shí)
73 # time.sleep(5)
74 # 關(guān)閉當(dāng)前窗口
75 # browser.close()
76 # 關(guān)閉所有已經(jīng)打開的窗口
77 # browser.quit()
定位操作
以下是所有定位操作的 API :
返回一個匹配元素, 即一個 WebElement 元素 find_element_by_id() find_element_by_name() find_element_by_class_name() find_element_by_tag_name() find_element_by_link_text() find_element_by_partial_link_text() find_element_by_xpath() find_element_by_css_selector() 返回一個列表, 包含所有匹配的元素, 即一個 WebElement 列表 find_elements_by_id() find_elements_by_name() find_elements_by_class_name() find_elements_by_tag_name() find_elements_by_link_text() find_elements_by_partial_link_text() find_elements_by_xpath() find_elements_by_css_selector()
關(guān)于 API 的具體介紹, 請參考 : module-selenium.webdriver.chrome.webdriver
使用的時(shí)候需注意下面幾點(diǎn) :
- python selenium 提供了兩種對象 :
WebDriver 和 WebElement
這兩種對象都可以使用這些 API
- 這些 API 一旦執(zhí)行失敗(即查找不到), 就會拋出異常
因此必須使用 try: .. except: ... 機(jī)制避免錯誤的行為影響程序繼續(xù)進(jìn)行
WebDriver 調(diào)用以上 API 進(jìn)行全局定位
WebElement 調(diào)用以上 API 可以進(jìn)行層級定位, 即 查找當(dāng)前元素的子元素
WebDriver 的使用
開始的時(shí)候必須要有初始化一個 WebDriver 實(shí)例, 即下面的 browser 用來對瀏覽器進(jìn)行控制以及頁面的訪問
# 請求連接
req_url = "http://www.haosou.com/s?ie=utf-8&shb=1&src=360sou_newhome&q=%E9%B2%9C%E8%8A%B1"
# 打開瀏覽器
browser = webdriver.Chrome()
# 開始請求
browser.get(req_url)
接著, 就可以使用以上 API 進(jìn)行當(dāng)前頁面的全局查找, 比如 :
# 獲取所有的廣告
all_ads_li = browser.find_elements_by_css_selector('#e_idea_pp li')
WebElement 的使用
-
使用 browser.find_element_by_xx() 得到的是一個 WebElement 實(shí)例 使用獲得的實(shí)例調(diào)用上面的 API 即可進(jìn)行層級查找
-
使用 browser.find_elements_by_xx() 得到的是一個元素是 WebElement 實(shí)例的 list 通過對 list 的遍歷, 即可對各個實(shí)例進(jìn)行相應(yīng)的操作
WebDriver 的一些常用操作
browser.curren_url : 獲取當(dāng)前加載頁面的 URL
browser.close() : 關(guān)閉當(dāng)前窗口, 如果當(dāng)前窗口是最后一個窗口, 瀏覽器將關(guān)閉
browser.quit() : 關(guān)閉所有窗口并停止 ChromeDriver 的執(zhí)行
-
browser.add_cookie(cookie_dict) : 為當(dāng)前會話添加 cookie
browser.get_cookie(name) : 得到執(zhí)行 cookie
browser.get_cookies() : 得到所有的 cookie
driver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’}) driver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’, ‘path’ : ‘/’}) driver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’, ‘path’ : ‘/’, ‘secure’:True})
-
browser.delete_all_cookies() : 刪除當(dāng)前會話的所有cookie
browser.delete_cookie(name) : 刪除指定 cookie
browser.back() : 相當(dāng)于瀏覽器的后退歷史記錄
browser.forward() : 相當(dāng)于瀏覽器的前進(jìn)歷史記錄
browser.execute_script(script, *args) : 同步執(zhí)行 js 腳本
browser.execute_async_script(script, *args) : 異步執(zhí)行 js 腳本
browser.get(url) : 在當(dāng)前窗口加載 url
browser.refresh() : 刷新當(dāng)前頁面
browser.current_window_handle : 當(dāng)前窗口的 handle, 相當(dāng)于一個指針一樣的東西, 用來指向當(dāng)前窗口
browser.window_handles : 當(dāng)前瀏覽器中的已經(jīng)打開的所有窗口, 是一個 list
browser.switch_to_window(window_handle) : 切換 window_handle 指向的窗口
browser.title : 當(dāng)前頁面的 title
browser.name : 當(dāng)前瀏覽器的名字
具體參照 : module-selenium.webdriver.remote.webdriver
WebElement 的一些常用操作
webEle.clear() : 清楚元素的內(nèi)容, 假如這個元素是一個文本元素
webEle.click() : 點(diǎn)擊當(dāng)前元素
webEle,is_displayed() : 當(dāng)前元素是否可見
webEle.is_enabled() : 當(dāng)前元素是否禁止, 比如經(jīng)常會禁用一些元素的點(diǎn)擊
webEle.is_selected() : 當(dāng)前元素是否選中, 文本輸入框的內(nèi)容
webEle.send_keys(*value) : 向當(dāng)前元素模擬鍵盤事件
webEle.submit() : 提交表單
webEle.tag_name : 當(dāng)前元素的標(biāo)簽名
webEle.text : 當(dāng)前元素的內(nèi)容
webEle.get_attribute(name) : 獲取當(dāng)前元素執(zhí)行屬性的值
??!本文轉(zhuǎn)自 https://www./mwumli/note/222253
|