博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python刷取CSDN博文访问量之三
阅读量:5911 次
发布时间:2019-06-19

本文共 1872 字,大约阅读时间需要 6 分钟。

python刷取CSDN博文访问量之三
 
作者:vpoet
注:这个系列我只贴代码,代码不注释.有兴趣的自己读读就懂了,纯属娱乐,望管理员抬手
若有转载一定不要注明来源
1 #coding=utf-8 2 import webbrowser 3 import time 4 import urllib2 5 import re 6 import os 7 import thread 8 import threading 9 mylock = threading.RLock()  10 11 tabcount=112 13 def BlogFun(n,url,MaxVisitor):14     visitcount = r'(\d+)人阅读'15     global tabcount 16     while True:17         mylock.acquire()  18         if tabcount >10:19             os.system('taskkill /F /IM chrome.exe')20             tabcount = 121         else:22             tabcount = tabcount + 123         mylock.release()  24         webbrowser.open(url,new=1)25         request=urllib2.Request(url)26         request.add_header('User-Agent','Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6')27         opener = urllib2.build_opener()28         fblog = opener.open(request)29         htm = fblog.read()30         Ref=re.findall(visitcount,htm);31         #print url+": "+str(int(Ref[0]))+"人阅读"32         if int(Ref[0])>MaxVisitor:33             break34         time.sleep(n)35 36 37 if __name__=="__main__":38 39     40     Domain="http://blog.csdn.net"41     main_url = "http://blog.csdn.net/u013018721"42     patt_article = r''43 44     Mainrequest=urllib2.Request(main_url)45     Mainrequest.add_header('User-Agent','Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6')46     opener = urllib2.build_opener()47     fMainblog = opener.open(Mainrequest)48     Mainhtml= fMainblog.read()49     article_urls = re.findall(patt_article,Mainhtml)50     threadnumber = 151     MaxVisitor = 30052     timedelay=353     for item in article_urls:54         Realurl =  Domain+item55         thread.start_new_thread(BlogFun,(timedelay,Realurl,MaxVisitor,))56         threadnumber=threadnumber+1

 

转载于:https://www.cnblogs.com/vpoet/p/4659562.html

你可能感兴趣的文章
linux 文件内容查找(当前文件夹下)
查看>>
io、nio、 aio
查看>>
FastDfs 文件系统迁移
查看>>
Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again
查看>>
数字格式化工具:Numeral.js 简介
查看>>
Redis学习手册(持久化)
查看>>
Django登录后,自动返回原操作页面的方法
查看>>
UltraEdit批量删除空行
查看>>
运行第一个容器 - 每天5分钟玩转容器技术(4)
查看>>
深入了解php opcode缓存原理
查看>>
java 内存溢出 栈溢出的原因与排查方法
查看>>
检查RPM包是否已经安装
查看>>
mysql实现vsftp虚拟用户访问
查看>>
(LNMP) How To Install Linux, nginx, MySQL, PHP
查看>>
write back vs write through
查看>>
要开始学习LINUX了
查看>>
各种链接
查看>>
开发工程师未来应具备的能力
查看>>
spring-boot项目中如何集成使用thymeleaf
查看>>
SQL Server中查看哪些游标未释放
查看>>