python

python OS模块批量处理文件

陈海飞阅读(1685)

处理文件和文件夹的模块——os os模块是Python和操作系统进行交互的一个接口,它提供了许多操作文件及文件夹的函数。因为本书在使用Python操控Excel时,会涉及很多与文件名、文件路径、文件夹相关的操作,所以下面介绍一下os模块的基...

python数组计算的数学模块-NumPy

陈海飞阅读(3808)

NumPy模块的名称是由“Numerical Python”缩写而来,这个模块是一个运行速度非常快的数学模块,主要用于数组计算。下面一起来看看NumPy模块的基本用法。 1、数组的基础知识 NumPy模块的主要特点就是引入了数组的概念。因为...

python数据导入和整理模块-pandas

陈海飞阅读(1443)

pandas模块是基于NumPy模块的一个开源Python模块,广泛应用于完成数据快速分析、数据清洗和准备等工作,它的名字来源于“panel data”(面板数据)。pandas模块提供了非常直观的数据结构及强大的数据管理和数据处理功能,某...

python批量处理Excel文件的模块——xlwings

陈海飞阅读(4081)

可以处理Excel文件的Python模块有很多,如XlsxWriter、xlrd、xlwt、xlutils、openpyxl和xlwings等。下表对各个模块的功能进行了简单对比。 通过上表的对比可以发现,xlwings模块的功能是最齐全的...

Python3字符解决去除换行|空格|分列符方法

陈海飞阅读(6050)

在Python3的编写过程中,获取到的字符串进场存在不明原因的换行和空格,如何整合成一个单句,成为问题。 方法1:使用strip()方法 方法2:替换 replace(“space”,””) ...

python脚本-批量获取网页标题

陈海飞阅读(6100)

1、由于现在需要做的网站优化越来越多,导致偶尔有的网站出现异常情况,不能及时发现,所以才有了此脚本。 2、主要用于批量获取网站标题,运行此脚本的前提是先要获取批量监测的网址url。 批量获取网页标题脚本: #coding:utf-8 #au...

wordpress 后台文章批量抓取id

陈海飞阅读(1191)

1、这个脚本主要是用于seo的链接提交,以及seo的主动推送,主要用于的是wordpress的网站站长。 2、这个脚本写着玩的,其实获取文章id的方法很多,最便捷的应该是通过数据库获取,此脚本涉及到一些爬虫的新知识,算是一个demo,算是一...

批量获取域名年龄

陈海飞阅读(903)

对于seo来说,域名年龄是判断网站竞争力的重要指标。 批量获取域名年龄脚本如下: #coding:utf-8 #author:http://www.chenhaifei.com/ import requests #打开 import tim...

批量查找百度问答浏览量

陈海飞阅读(1299)

需求:由于最近做了一批百度问答的词,想统计效果,由于数量较多,所以想到了用python抓取实现,以增加工作效率。 通过分析分析发现,浏览量不是静态的,是通过另外一个链接获取的,如下图 链接:https://zhidao.baidu.com/...

如何使用python批量修改文件内容

陈海飞阅读(2849)

需求:由于需要对文件进行同样的处理,如我需要将打广告的代码都删除掉,文件很多。 代码如下: import os,sys path=”C:/Users/apple/Desktop/科技类文章”#这里是你的第一级文件夹的...

Python学好了能不能找到工作?

陈海飞阅读(9558)

博主以自己的亲身经历举例,我是主职是做seo的,期间学习了Python,主要内容是爬虫,但是并不精通,只是够用而已,会BeautifulSoup,Reques等,这些并不够让自己应聘成为一名初级Python工程师。 想要通过学习Python...

python前端、框架和其他面试题(155题)

陈海飞阅读(2542)

1、谈谈你对http协议的认识。 2、谈谈你对websocket协议的认识。 3、什么是magic string ? 4、如何创建响应式布局? 5、你曾经使用过哪些前端框架? 6、什么是ajax请求?并使用jQuery和XMLHttpReq...

Python面试题基础篇(80题)

陈海飞阅读(3818)

1、为什么学习Python? 2、通过什么途径学习的Python? 3、Python和Java、PHP、C、C#、C++等其他语言的对比? 4、简述解释型和编译型编程语言? 5、Python解释器种类以及特点? 6、位和字节的关系? 7、b...

BeautfulSoup4最常用的5个函数【转载】

陈海飞阅读(2840)

1、BeautifulSoup是爬取网页信息使用频率最高的库,下面简单介绍一下我编写脚本过程中利用bs4获取信息的方法。 2、本文用到到网的某一购物场所作为例子: url=’http://www.tripadvisor.cn/A...

pip更新全部packages

陈海飞阅读(3850)

1、问题描述 pip可以用pip install –upgrade xxx更新指定的package,但是并没有提供一个更新全部的命令。要是有类似–upgrade all或–upgrade *这样的方式该有...

查反链的友链脚本

陈海飞阅读(4694)

现在查友链的工具响应都很慢,我这个脚本的逻辑就是先将我们的友链整理出来,再直接查,有没有我们网站的字段,以确定是否挂有我们的网站,要注意的是无法确定是否带有nofllow标签,还有就是因为http响应的效率问题,不保证100%准确,可以多试...

[post+json]批量查询网站权重脚本

陈海飞阅读(3953)

此脚本的初衷是因为我们网站分站较多,而站长工具批量查询站点权重,无法导入,因此此脚本产生了。 #coding=utf8 import requests import re import json headers = { ‘Use...

python2.7 99乘法表

陈海飞阅读(7865)

python3.0 end方法就可以自由使用的,在2.7版本,需要新增from __future__ import print_function。 end=””主要是为了打印的时候不是换行,而是在后面新增空格。 fr...

python批量创建文件夹

陈海飞阅读(2930)

python批量创建文件夹,主要是为了批量的新建文件夹,形成序号,可以系统的管理自己的文档,增加办公的效率。 #coding:utf-8 #author:www.chenhaifei.com import os #打开 with open(...

百度批量主动推送+分文件脚本

陈海飞阅读(1997)

因为百度批量推送脚本的时候最大只能推送2000条,所以要有一个分文件脚本进行辅助。 百度批量主动推送 #coding=utf8 import requests url = ‘http://data.zz.baidu.com/ur...

python设置环境变量【详细图解】

陈海飞阅读(8254)

为什么要设置环境变量? 详细解释是环境变量是在操作系统中一个具有特定名字的对象,它包含了一个或者多个应用程序所将使用到的信息。例如Windows和DOS操作系统中的path环境变量,当要求系统运行一个程序而没有告诉它程序所在的完整路径时,系...

python 批量获取http状态码

陈海飞阅读(5699)

脚本作用:批量获取http状态码可以检测出有异常情况的页面,从而找到问题页面,寻找原因或者删除死链等。 python获取http状态码脚本如下: #coding:utf-8 #author:www.chenhaifei.com import...

python 笑话大全接口脚本

陈海飞阅读(3553)

今天用阿里云的时候,发现阿里云很强大,提供了很多便宜的接口,很多都是1分钱可以查询100次的(炒鸡划算),于是好奇心驱使下就写了以下的脚本,试验一番,结果当然很完美(嘚瑟ing) ####阿里云接口购买地址:https://market.a...

正则表达式 – 入门篇[转载]

陈海飞阅读(3339)

在线测试正则表达式 http://regexr.com/是一个提供在线版的正则式编辑、学习、创建和测试的平台,帮助编程人员快速的编写正则表达式,内置多种转义字符,点击即可添加,同时还拥有在线保存和分享的功能。 1.元字符 模式 描述 . 匹...

我写Python脚本时常用的调试手段

陈海飞阅读(2608)

1、查看运行结果异常报错(error) 遇到这种error,我都会打开百度翻译,复制某某error,查看一下是什么异常或者打开http://www.runoob.com/python/python-exceptions.html此链接,ct...

Python中列表(List)方法(基础)

陈海飞阅读(4460)

列表是最常用的Python数据类型,它可以作为一个方括号内的逗号分隔值出现。列表的数据项不需要具有相同的类型。 Python列表赋值 list1 = [‘physics’, ‘chemistry̵...

Python中列表(list)常用函数方法

陈海飞阅读(3826)

上文Python中列表(List)方法(基础 Python列表函数 函数 描述 实例 “”.join(list) 将list转成字符 a1=[‘a’,’b’,̵...

python批量获取百度关键词相关结果数

陈海飞阅读(8289)

分析关键词在百度的相关结果数 有利于了解关键词在百度的竞争程度,比如一个很热门的词,那么它的相关结果数必然很高,因为大家都想做此关键词的排名,对于做SEO,这类词是不适合我们竞争的,因为这类关键词基本需求已经处于饱和状态,想要获取排名,需要...

Python如何抓取异步加载数据

陈海飞阅读(3804)

1、寻找异步加载的接口 通过谷歌浏览器的Network查找,一般异步加载常见的有两个可能:XHR,JS。所以我们在点击进行响应时,只要观察这两项加载的内容就可以清晰的知道接口的地址。(需要注意的是:Request常用的有两种情况,1.get...

python beautifulsoup4 安装及使用案例

陈海飞阅读(1842)

python beautifulsoup4 安装 下载beautifulsoup链接: https://pypi.python.org/pypi/beautifulsoup4(下载type为Source的文件夹) 下载步骤:运行cmd,切换...

http协议请求中常见的get和post方法

陈海飞阅读(4225)

#为什么只单讲get和post方法? 因为我最近抓取网页时发现,大部分网站最常见的就是这两种方法,这也是我为什么会研究http协议的原因。 #get和post的区别 get – 从指定的服务器中获取数据。post –...

python脚本-挖掘百度下拉框关键词

陈海飞阅读(2353)

注意: 1、下面的脚本直接复制无法执行,会有缩进和中英文符号的问题导致脚本无法运行。(可以通过脚本截图进行修改) 2、此脚本主要是用与批量挖掘百度下拉框词的脚本。 如下图: 挖掘百度下拉框关键词python脚本 #coding=utf8 i...

[转载]HTTP协议详解

陈海飞阅读(2117)

引言 HTTP是一个属于应用层的面向对象的协议,由于其简捷、快速的方式,适用于分布式超媒体信息系统。它于1990年提出,经过几年的使用与发展,得到不断地完善和扩展。目前在WWW中使用的是HTTP/1.0的第六版,HTTP/1.1的规范化工作...

[转载]python requests的安装与简单运用

陈海飞阅读(1320)

requests是python的一个HTTP客户端库,跟urllib,urllib2类似,那为什么要用requests而不用urllib2呢?官方文档中是这样说明的: python的标准库urllib2提供了大部分需要的HTTP功能,但是A...

Python中常用内置函数【实例】

陈海飞阅读(5295)

函数 描述 实例 abs() abs() 函数返回数字的绝对值。 print abs(-1);返回值为:1 divmod() divmod() 函数把除数和余数运算结果结合起来,返回一个包含商和余数的元组(a // b, a % b)。 d...