python爬虫需要调用什么模块

发布时间：2020年11月08日 11:00:46 来源：环球青藤点击量：1313

【摘要】python 爬虫常用模块：相关推荐：python爬虫库以及相关利器Python标准库——urlpb模块功能：打开URL和http协议之类注：python 3 x中urlpb

python 爬虫常用模块：

相关推荐：python爬虫库以及相关利器

Python标准库——urlpb模块

功能：打开URL和http协议之类

注：python 3.x中urlpb库和uripb2库合并成了urlpb库。其中urlpb2.urlopen()变成了urlpb.request.urlopen()，urlpb2.Request()变成了urlpb.request.Request()

urlpb请求返回网页

urlpb.request.urlopen

urlpb.request.open(url[,data,[timeout,[cafile,[capth[,cadefault,[context]]]]]])

urlpb.requset.urpoen可以打开HTTP（主要）、HTTPS、FTP、协议的URL

ca 身份验证

data 以post方式提交URL时使用

url 提交网络地址（全程前端需协议名后端需端口 http:/192.168.1.1:80）

timeout 超时时间设置

函数返回对象有三个额外的方法

geturl() 返回response的url信息

常用与url重定向info()返回response的基本信息

getcode()返回response的状态代码

示例：

#coding:utf-8
import urlpb.request
import time
import platform


#清屏函数(无关紧要 可以不写)
def clear():
    print(u"内容过多 3秒后清屏")
    time.sleep(3)
    OS = platform.system()
    if (OS == u'Windows'):
        os.system('cls')
    else:
        os.system('clear')
#访问函数
def pnkbaidu():
    url = 'http://www.baidu.com'
    try:
        response = urlpb.request.urlopen(url,timeout=3)
    except urlpb.URLError:
        print(u'网络地址错误')
        exit()
    with open('/home/ifeng/PycharmProjects/pachong/study/baidu.txt','w') as fp:
        response = urlpb.request.urlopen(url,timeout=3)
        fp.write(response.read())
    print(u'获取url信息，response.geturl()n:%s'%response.getrul())
    print(u'获取返回代码，response.getcode()n:%s' % response.getcode())
    print(u'获取返回信息，response.info()n:%s' % response.info())
    print(u"获取的网页信息经存与baidu.txt")


if __name__ =='main':
    pnkbaidu()

Python标准库–logging模块

logging模块能够代替print函数的功能，将标准输出到日志文件保存起来，利用loggin模块可以部分替代debug

re模块

正则表达式

sys模块

系统相关模块

sys.argv(返回一个列表，包含所有的命令行)

sys.exit(退出程序)

Scrapy框架

urlpb和re配合使用已经太落后，现在主流的是Scrapy框架

更多Python相关技术文章，请访问Python教程栏目进行学习！

以上就是小编分享的关于python爬虫需要调用什么模块的详细内容希望对大家有所帮助，更多有关python教程请关注环球青藤其它相关文章！

分享到：编辑：wangmin

上一篇：怎么查看python版本? 下一篇：pow在python中是什么意思

就业培训申请领取

您的姓名

您的电话

意向课程

点击领取

环球青藤

官方QQ群

扫描上方二维码或点击一键加群，免费领取大礼包，加群暗号：青藤。一键加群

Python编程相关文章推荐

Python编程最新文章推荐

免费直播更多

应《中华人民共和国网络安全法》加强实名认证机制要求,同时为更加全面的体验产品服务,烦请您绑定手机号.

预约成功

本直播为付费学员的直播课节

请您购买课程后再预约

我要购买

最新文章

环球青藤移动课堂APP 直播、听课。职达未来！

安卓版

下载

iPhone版

下载

环球青藤官方微信服务平台

刷题看课 APP下载

免费直播一键购课

代报名等人工服务

Python编程热点排行

python爬虫需要调用什么模块

就业培训申请领取

Python编程相关文章推荐

Python编程最新文章推荐

绑定手机号

注册账号

环球青藤用户注册

python爬虫需要调用什么模块

就业培训申请领取

Python编程相关文章推荐

Python编程最新文章推荐

绑定手机号

注册账号

环球青藤用户注册

欢迎登陆环球青藤