一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

腳本之家,腳本語言編程技術(shù)及教程分享平臺(tái)!
分類導(dǎo)航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務(wù)器之家 - 腳本之家 - Python - Python 通過正則表達(dá)式快速獲取電影的下載地址

Python 通過正則表達(dá)式快速獲取電影的下載地址

2020-08-17 18:31Amo Xiang Python

這篇文章主要介紹了Python 通過正則表達(dá)式快速獲取電影的下載地址,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

在爬取網(wǎng)頁信息時(shí),如果在HTML代碼中通過獲取標(biāo)簽的方式來提取電影的下載地址時(shí),不僅要編寫比較多的代碼,還需要不斷的確認(rèn)每一層的標(biāo)簽是否正確,這樣的操作無疑是煩瑣的。如下圖所示。那么通過什么方式既可以減少代碼量,又可以很簡單的提取指定標(biāo)簽的內(nèi)容呢?本文將實(shí)現(xiàn)通過正則表達(dá)式快速獲取電影的下載地址。如果對(duì)正則表達(dá)式不熟悉的讀者,點(diǎn)擊 此處 學(xué)習(xí)正則表達(dá)式。

Python 通過正則表達(dá)式快速獲取電影的下載地址

在爬取網(wǎng)頁信息的任務(wù)中,可以使用正則表達(dá)式的方式快速的提取某個(gè)標(biāo)簽內(nèi)的指定信息,以爬取電影的下載地址為例。本案例需要注意編碼格式的問題,單擊鼠標(biāo)右鍵,如圖所示查看網(wǎng)頁編碼:

Python 通過正則表達(dá)式快速獲取電影的下載地址

代碼如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
import re
import requests
 
 
def get_movies(url):
 # 構(gòu)造請(qǐng)求頭
 headers = {
  "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/53"
      "7.36 (KHTML, like Gecko) Chrome/81.0.4044.122 Safari/537.36"
 }
 response = requests.get(url, headers=headers) # 發(fā)送請(qǐng)求
 response.encoding = "gb2312" # 設(shè)置編碼方式
 # 判斷請(qǐng)求是否成功 根據(jù)狀態(tài)碼是否等于200來判斷
 if response.status_code == 200:
  # 獲取每個(gè)電影詳情頁地址,通過正則表達(dá)式提取電影詳情頁地址
  # <a href="/html/gndy/dyzz/20200411/59903.html" rel="external nofollow" class="ulink">2020年動(dòng)作《絕地戰(zhàn)警:疾速追擊》BD中英雙字幕</a>
  movies_info = re.findall(r'<a href="(.*?)" rel="external nofollow" class="ulink">', response.text) # 返回符合表達(dá)式規(guī)則的數(shù)據(jù)列表
  print(len(movies_info))
  for url in movies_info: # 循環(huán)每個(gè)電影的詳情頁地址
   info_url = "https://www.ygdy8.net" + url # 拼接完整地址
   # 對(duì)電影詳情頁發(fā)送請(qǐng)求
   movies_info_response = requests.get(info_url, headers=headers)
   movies_info_response.encoding = "gb2312" # 設(shè)置編碼方式
   # 通過表達(dá)式匹配電影的下載地址
   download_url = re.findall(r'<a href=".*?" rel="external nofollow" >(.*?)</a></td>', movies_info_response.text)
   print(download_url)
 
 
if __name__ == '__main__':
 get_movies("https://www.ygdy8.net/html/gndy/dyzz/index.html")

運(yùn)行結(jié)果如下:

['ftp://ygdy8:[email protected]:8014/陽光電影www.ygdy8.com.名字之歌.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:6015/陽光電影www.ygdy8.com.我仍然相信.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:8018/陽光電影www.ygdy8.com.阿肯色.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:4028/陽光電影www.ygdy8.com.驚天營救.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:8067/陽光電影www.ygdy8.com.狩獵的時(shí)間.BD.1080p.韓語中字.mkv']
['ftp://ygdy8:[email protected]:7018/陽光電影www.ygdy8.com.7號(hào)房的禮物.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:8017/陽光電影www.ygdy8.com.格蕾特和韓塞爾.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:3028/陽光電影www.ygdy8.com.看不見的女人.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:7067/陽光電影www.ygdy8.com.我們永不言棄.HD.1080p.國語中字.mkv']
['ftp://ygdy8:[email protected]:4026/陽光電影www.ygdy8.com.軍人的妻子.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:6014/陽光電影www.ygdy8.com.匹諾曹.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:4025/陽光電影www.ygdy8.com.葉問4:完結(jié)篇.BD.1080p.國粵雙語中字.mkv']
['ftp://ygdy8:[email protected]:3024/陽光電影www.ygdy8.com.節(jié)奏組.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:8013/陽光電影www.ygdy8.com.江湖兒女.BD.1080p.國語中字.mkv']
['ftp://ygdy8:[email protected]:3026/陽光電影www.ygdy8.com.瓊斯先生.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:7013/陽光電影www.ygdy8.com.地球最后的夜晚.BD.1080p.國語中字.mkv']
['ftp://ygdy8:[email protected]:3023/陽光電影www.ygdy8.com.夢幻島.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:4023/陽光電影www.ygdy8.com.擰緊.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:4026/陽光電影www.ygdy8.com.悲慘世界.BD.1080p.法語中字.mkv']
['ftp://ygdy8:[email protected]:4022/陽光電影www.ygdy8.com.真人快打傳奇:蝎子的復(fù)仇.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:7016/陽光電影www.ygdy8.com.我的間諜.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:3021/陽光電影www.ygdy8.com.從不,很少,有時(shí),總是.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:4025/陽光電影www.ygdy8.com.絕地戰(zhàn)警:疾速追擊.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:3020/陽光電影www.ygdy8.com.紳士們.BD.1080p.中英雙字幕.mkv']
['ftp://ygdy8:[email protected]:8065/陽光電影www.ygdy8.com.二分之一的魔法.BD.1080p.中英雙字幕.mkv']
1

筆者在這里聲明,筆者寫文章只是為了 學(xué)習(xí)交流,以及讓更多學(xué)習(xí)Python基礎(chǔ)的讀者少走一些彎路,節(jié)省時(shí)間,并不用做其他用途,如有侵權(quán),聯(lián)系刪除即可。

到此這篇關(guān)于Python 通過正則表達(dá)式快速獲取電影的下載地址的文章就介紹到這了,更多相關(guān)Python 正則表達(dá)式下載地址內(nèi)容請(qǐng)搜索服務(wù)器之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持服務(wù)器之家!

原文鏈接:https://blog.csdn.net/xw1680/article/details/105853036

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 小寡妇好紧进去了好大看视频 | 亚洲久草在线 | 精品国产91久久久久久久a | 美女张开大腿让男人桶 | 欧美兽皇video | 青青草原在线 | 国产精品久久国产精品99 | 免费av在线看| 天天操夜夜操狠狠操 | 国产二区视频 | 精品国产成人a区在线观看 精品高潮呻吟99AV无码视频 | 欧美亚洲国产精品久久久 | 日韩 国产 欧美 精品 在线 | 6080伦理久久精品亚洲 | 啪啪大幂幂被c | 久久综合久综合久久鬼色 | 国产精品久久久久久影院 | 成人免费视频一区 | 暖暖 免费 高清 日本 在线1 | 九九精品国产亚洲A片无码 九九99热久久999精品 | 日本三级免费看 | 肉大捧一进一出视频免费播放 | 美女脱了内裤张开腿亲吻男生 | 黑人双渗透 | 国产人成激情视频在线观看 | 国模大胆一区二区三区 | 国产精品一区二区三 | 日本一本草久p | 久久三级视频 | 男人的j插入女人的p | 日韩精品免费一区二区 | 国产女乱淫真高清免费视频 | aaa大片| 久草在线精彩免费视频 | 青青国产成人久久激情911 | 国产精品一级视频 | 免费网站视频 | 成人亚洲欧美日韩在线观看 | 高h肉厨房| 亚洲成人国产精品 | 成人免费观看www视频 |