一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - PHP網頁抓取之抓取百度貼吧郵箱數據代碼分享

PHP網頁抓取之抓取百度貼吧郵箱數據代碼分享

2020-08-19 10:03國盛工作室 Python

本文給大家介紹PHP網頁抓取之抓取百度貼吧郵箱數據代碼分享,程序實現了一鍵抓取帖子全部郵箱和分頁抓取郵箱兩個功能,感興趣的朋友一起學習吧

百度貼吧大家都經常逛,去逛百度貼吧的時候,經常會看到樓主分享一些資源,要求留下郵箱,樓主才給發。

對于一個熱門的帖子,留下的郵箱數量是非常多的,樓主需要一個一個的去復制那些回復的郵箱,然后再粘貼發送郵件,不是被折磨死就是被累死。無聊至極寫了一個抓取百度貼吧郵箱數據的程序,需要的拿走。

程序實現了一鍵抓取帖子全部郵箱和分頁抓取郵箱兩個功能,界面懶得做了,效果如下:

PHP網頁抓取之抓取百度貼吧郵箱數據代碼分享

老規矩,直接貼源碼

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
<?php
$url2="";
$page="";
if($_GET['url2']==""){
$url2="http://tieba.baidu.com/p/2314539885?pn=1";
}else{
$url2=$_GET['url2'];
}
 
if($_GET['page']==""){
$page="1";
}else{
$page=$_GET['page'];
}
?>
<form action="" method="get">
<input type="hidden" value="getAll" name="type" />
<table>
<tr>
<td>帖子鏈接:</td><td><input type="text" name="url" value="http://tieba.baidu.com/p/2314539885" style="width:300px;" /></td>
</tr>
<tr>
<td>總頁數:</td><td><input type="text" name="page" style="width:300px;" value="<?php echo $page;?>" /></td>
</tr>
<tr>
<td colspan=2><input type="submit" value="抓取全部郵箱數據" /></td>
</tr>
</table>
</form>
 
<form action="" method="get">
<input type="hidden" value="getNow" name="type" />
<table>
<tr>
<td>帖子鏈接:</td><td><input type="text" name="url2" value="<?php echo $url2;?>" style="width:300px;" /></td>
</tr>
<tr>
<td colspan=2><input type="submit" value="抓取當前頁面郵箱數據" /></td>
</tr>
</table>
</form>
<?php
if($_GET['type']!=""){
$counts=0;
if($_GET['type']=="getAll"){
$pages=$_GET['page'];
$url = $_GET['url'];
for($i=0;$i<$pages;$i++){
$ch2 = curl_init();
curl_setopt($ch2, CURLOPT_URL, $url);
curl_setopt($ch2, CURLOPT_FOLLOWLOCATION, TRUE);
curl_setopt($ch2, CURLOPT_SSL_VERIFYHOST, FALSE);
curl_setopt($ch2, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch2, CURLOPT_RETURNTRANSFER, TRUE);
$texts = curl_exec($ch2);
curl_close($ch2);
$dat=getEmail($texts);
for($j=0;$j<count($dat);$j++){
echo $dat[$j]."<br />";
$counts++;
}
}
}else if($_GET['type']=="getNow"){
$url = $_GET['url2'];
$ch2 = curl_init();
curl_setopt($ch2, CURLOPT_URL, $url);
curl_setopt($ch2, CURLOPT_FOLLOWLOCATION, TRUE);
curl_setopt($ch2, CURLOPT_SSL_VERIFYHOST, FALSE);
curl_setopt($ch2, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch2, CURLOPT_RETURNTRANSFER, TRUE);
$texts = curl_exec($ch2);
curl_close($ch2);
$dat=getEmail($texts);
for($i=0;$i<count($dat);$i++){
echo $dat[$i]."<br />";
$counts++;
}
}
echo '<h2>共采集到數據:'.$counts.'條</h2>';
}
function getEmail($str){
$pattern = "/([a-z0-9\-_\.]+@[a-z0-9]+\.[a-z0-9\-_\.]+)/";
preg_match_all($pattern,$str,$emailArr);
return $emailArr[0];
}
?>

 

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 男男playh片在线观看 | 久久精品午夜一区二区福利 | 国产精品视频久久久 | 视频国产91| 亚洲另类激情 | 九九99亚洲精品久久久久 | 亚洲国产午夜看片 | 成人免费视频一区 | 妹妹你插的我好爽 | ass天天裸妇pics| 久久学生精品国产自在拍 | 国产激情一区二区三区四区 | 免费看男人使劲躁女人小说 | 91色在线观看国产 | 9总探花新品牛仔背带裤 | 91亚洲精品第一综合不卡播放 | 免费xxxxx大片在线观看影视 | 日本xxxxx69hd日本 | 日本一级不卡一二三区免费 | 我的年轻漂亮继坶三级 | 91精品国产一区 | 国产一区二区视频在线观看 | 扒开老师挠尿口到崩溃刑罚 | 亚洲六月丁香婷婷综合 | 黑人破中国女人处 | 艾秋麻豆果冻传媒老狼仙踪林 | 99视频观看| 日韩欧美国产综合精品 | 波多野结衣中文字幕乱七八糟 | 国产一区私人高清影院 | 国产91网站在线观看 | 国产精品久久久久久网站 | 暖暖在线精品日本中文 | 极品在线 | 天堂日韩| free白嫩性hd| 黑人巨荃大战乌克兰美女 | 成人精品一区二区三区 | 国产高清亚洲 | 日韩网站在线 | 处女摘花 |