标签:python脚本

14 篇文章

python脚本-批量获取网页标题
1、由于现在需要做的网站优化越来越多,导致偶尔有的网站出现异常情况,不能及时发现,所以才有了此脚本。 2、主要用于批量获取网站标题,运行此脚本的前提是先要获取批量监测的网址url。 批量获取网页标题脚本: #coding:utf-8 #author: import requests #打开 import time,random #控制时间 impo…
wordpress 后台文章批量抓取id
1、这个脚本主要是用于seo的链接提交,以及seo的主动推送,主要用于的是wordpress的网站站长。 2、这个脚本写着玩的,其实获取文章id的方法很多,最便捷的应该是通过数据库获取,此脚本涉及到一些爬虫的新知识,算是一个demo,算是一个记录,为后面写脚本提供参考, 脚本如下: #coding:utf-8 #author:http://www.…
批量查找百度问答浏览量
需求:由于最近做了一批百度问答的词,想统计效果,由于数量较多,所以想到了用python抓取实现,以增加工作效率。 通过分析分析发现,浏览量不是静态的,是通过另外一个链接获取的,如下图 链接:https://zhidao.baidu.com/question/751064228438044612.html 另一个链接主要组成部分是这个页面的id,所以…
如何使用python批量修改文件内容
需求:由于需要对文件进行同样的处理,如我需要将打广告的代码都删除掉,文件很多。 代码如下: import os,sys path="C:/Users/apple/Desktop/科技类文章"#这里是你的第一级文件夹的路径 filenames= os.listdir(path)#将path路径下的所有文件名存入列表filenames for file…
查反链的友链脚本
现在查友链的工具响应都很慢,我这个脚本的逻辑就是先将我们的友链整理出来,再直接查,有没有我们网站的字段,以确定是否挂有我们的网站,要注意的是无法确定是否带有nofllow标签,还有就是因为http响应的效率问题,不保证100%准确,可以多试几次,以保障准确性。 #coding:utf-8 #author:www.chenhaifei.com imp…
python2.7 99乘法表
python3.0 end方法就可以自由使用的,在2.7版本,需要新增from __future__ import print_function。 end=""主要是为了打印的时候不是换行,而是在后面新增空格。 from __future__ import print_function for i in range(1,10): for j in …
python批量创建文件夹
python批量创建文件夹,主要是为了批量的新建文件夹,形成序号,可以系统的管理自己的文档,增加办公的效率。 #coding:utf-8 #author:www.chenhaifei.com import os #打开 with open('name.txt')as f: for i in f: name=i.strip() os.makedirs…
百度批量主动推送+分文件脚本
因为百度批量推送脚本的时候最大只能推送2000条,所以要有一个分文件脚本进行辅助。 百度批量主动推送 #coding=utf8 import requests url = 'http://data.zz.baidu.com/urls?site=newhouse.nj.house365.com&token=h5NoG7bfjR2Yk2sq' …
python 批量获取http状态码
脚本作用:批量获取http状态码可以检测出有异常情况的页面,从而找到问题页面,寻找原因或者删除死链等。 python获取http状态码脚本如下: #coding:utf-8 #author:www.chenhaifei.com import requests #打开 import time,random #控制时间 import sys  #专门乱…
python 笑话大全接口脚本
今天用阿里云的时候,发现阿里云很强大,提供了很多便宜的接口,很多都是1分钱可以查询100次的(炒鸡划算),于是好奇心驱使下就写了以下的脚本,试验一番,结果当然很完美(嘚瑟ing) ####阿里云接口购买地址:https://market.aliyun.com/1111promotion import urllib, urllib2, sys imp…
python批量获取百度关键词相关结果数
分析关键词在百度的相关结果数 有利于了解关键词在百度的竞争程度,比如一个很热门的词,那么它的相关结果数必然很高,因为大家都想做此关键词的排名,对于做SEO,这类词是不适合我们竞争的,因为这类关键词基本需求已经处于饱和状态,想要获取排名,需要的周期和代价会很大。 python脚本如下 #coding:utf-8 #author: import req…
Python如何抓取异步加载数据
1、寻找异步加载的接口 通过谷歌浏览器的Network查找,一般异步加载常见的有两个可能:XHR,JS。所以我们在点击进行响应时,只要观察这两项加载的内容就可以清晰的知道接口的地址。(需要注意的是:Request常用的有两种情况,1.get 2. post) get的情况:查看Request URL post的情况:在写脚本的时候需要加上data数…
python脚本-挖掘百度下拉框关键词
注意: 1、下面的脚本直接复制无法执行,会有缩进和中英文符号的问题导致脚本无法运行。(可以通过脚本截图进行修改) 2、此脚本主要是用与批量挖掘百度下拉框词的脚本。 如下图: 挖掘百度下拉框关键词python脚本 #coding=utf8 import re,requests import time headers = { 'User-Agent':…