登录  | 立即注册

游客您好!登录后享受更多精彩

扫一扫,访问微社区

QQ登录

只需一步,快速开始

开启左侧

[寒假笔记] Python网络爬虫——http协议及request库方法

[复制链接]
发表于 2019-2-16 23:03:43 | 显示全部楼层 |阅读模式
学习笔记
学习科目: 编程
学习安排: 学习http协议以及request库
开始时间: 2019-02-16
结束时间: 2019-02-16
今天学习了爬虫的http协议和request库的使用。
首先是http协议

230341ssczomfqaqazcxtr.jpg
请求与响应简单的理解为:用户发起请求,服务器作相关响应。
无状态指的是:第一次请求与第二次请求之间没有相关的关联。
应用层协议指的是:该协议在http协议工作之上。

http协议一般采用url作为定位网络资源的标识。

230342gi8rz0vvpiv00lv2.jpg
每一个url包括三个域,其中port域可以省略,若省略则端口为80

230342ilobllylcf65czyx.jpg
http协议有六个基础操作。这六个基础操作和request库用法相同。

GET和HEAD都可以获取url资源。不同的是,HEAD只能获取URL的部分资源,并分析该资源的大概内容,适用于URL资源很大难以获取是使用。

POST,PUT和PATCH都可以向URL添加资源。POST是添加新的资源,PUT是将新的资源覆盖在原来的资源上,PATCH可以将URL某些位置的某些资源进行修改。

DELETE可以删除URL的相关资源。

一下是关系图
230343hppn002ltpn0yv2q.jpg
下面来具体理解PATCH和PUT的区别

230343rkuncfkcufgk04zd.jpg
既自以心为形役,奚惆怅而独悲。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表