python爬虫抓手机号java客户端小程序
目录
python爬虫抓手机号+java客户端小程序
介绍
前几天做了个抓手机号的爬虫,这两天没啥事就学了学java swing,然后想着给蛇画俩腿,额 是给那个小程序做个界面。
大概组件怎么用,布局怎么用,照着书上学了个大概,就迫不急待的动手了,今天终于做成了。记录一下过程,以后要是忘记,可以回来看看。
成品图:
从python开始
那么就从python爬虫开始吧。毕竟python一共也没学多长时间,记录一下,以后忘了还能来看看。
我安的2.7版本python,安装很简单一路下一步就安好了, 留个备份。
然后下了个社区版的PyCharm,就可以正式开始了。
这就写好了,pages决定抓这个网站几页的手机号。
# coding: UTF-8
import re
import requests
def write(page):
r = requests.get("http://www.0597zp.com/more.php?page="+str(page))
result = re.findall('target=_blank>(.*?)</A>',r.content)
if(len(result)>0):
tempfile = open("mobile.txt",'a')
for i in result:
print (i + ";")
tempfile.write(i + ";")
tempfile.write("\n")
tempfile.close()
pages=10
for i in range(0,pages+1):
write(i)
requests是需要安装的,打开cmd,命令:pip install requests,就ok了,要是pip用不了那就是python环境变量没搭好。
这几行代码没啥好说的,requests用法网上就有,正则挺麻烦的,好在原来看过个视频讲过这个贪心算法(.*?)挺好使的。暂且先用着把,等我以后成长到适当水平在来研究它,现在需要学的东西多着呢,就不跟它耗着了。
这个网站每页100条,抓了10页的数据:
嗯 这个小程序就写好了,下篇写java界面吧。我总怕看太长的文章,所以就这样结束把。