第一章 单元测试
1、单选题:下列不属于常见爬虫类型的是()。
A:增量式网络爬虫
B:通用网络爬虫
C:浅层网络爬虫
D:聚焦网络爬虫
正确答案:【浅层网络爬虫】
2、单选题:下列不属于聚焦网络爬虫的常用策略的是()。
A:基于内容评价的爬取策略
B:基于深度优先的爬取策略
C:基于链接结构评价的爬取策略
D:基于语境图的爬取策略
正确答案:【基于深度优先的爬取策略】
3、单选题:下列不属于常用反爬手段的是()。
A:人工筛选
B:反爬频度
C:账号权限
D:验证码校验
正确答案:【人工筛选】
4、单选题:下列属于反爬虫目的的是()。
A:限制用户访问权限
B:限制访问人数
C:防止网站信息被竞争对手随意获取
D:变换网页结构
正确答案:【防止网站信息被竞争对手随意获取】
5、单选题:下列属关于Python爬虫库的功能描述不正确的是()。
A:HTML/XML解析器pycurl`
B:通用爬虫库urllib3
C:爬虫框架 Scrapy
D:通用爬虫库 Requests
正确答案:【HTML/XML解析器pycurl`】
6、判断题:搜索引擎使用了网络爬虫不停地从互联网抓取网站数据,并将网站镜像保存在本地。()
A:错
B:对
正确答案:【对】
7、判断题:robots.txt文件中,User-agent后面跟的是爬虫的名称,Disallow后面跟着的是可以爬虫的网页。()
A:错
B:对
正确答案:【错】
8、判断题:爬虫是手动请求万维网网站且提取网页数据的程序。()
A:对
B:错
正确答案:【错】
9、判断题:每个网站都有robots.txt文件。()
A:错
B:对
正确答案:【错】
10、判断题:爬虫爬取的是网站后台的数据。()
A:对
B:错
正确答案:【错】
第二章 单元测试
1、单选题:吉多设计Python的灵感来源于()。
A:Unix shell
B:C语言
C:ABC语言
D:Java语言
正确答案:【ABC语言】
2、单选题:下列关于Python语言的特点说法中,错误的是()。
A:Python语言是非开源语言
B:ANSI C
C:Python语言是跨平台语言
D:Go
正确答案:【Python语言是非开源语言】
3、单选题:Python源代码文件的后缀名是()
A:pdf
B:doc
C:py
D:png
正确答案:【py】
4、单选题:列表list=[1,2,3,4,5],下列选项中为空的是()
A:list[1:]
B:ist[1:1]
C:list[1:-1]
D:list[:-2]
正确答案:【ist[1:1]】
5、单选题:Python语言中用来定义函数的关键字是()
A:class
B:def
C:return
D:function
正确答案:【def】
6、判断题:在安装Python时,需要根据已有的系统来选择相应的安装程序。安装后,也需要配置环境变量。()
A:错
B:对
正确答案:【对】
7、判断题:elif语句可以单独使用。()
A:错
B:对
正确答案:【错】
8、判断题:元组的元素不能修改。()
A:对
B:错
正确答案:【对】
9、多选题:下列选项中,不能创建元组的语句是()。
A:tup=[1,2,3]
B:tup = (1,2,98)
C:tup=tuple([1,2,3])
D:tup=(2)
正确答案:【tup=[1,2,3];
tup=(2)】
第三章 单元测试
1、单选题:如果站点服务器支持安全套接层(SSL),那么连接到安全站点上的所有URL开头是( )。
A:SHTTP
B:HTTP
C:SSL
D:HTTPS
正确答案:【HTTPS】
2、单选题:body元素用于背景颜色的属性是( )。
A:background-color
B:alink
C:vlink
D:color
正确答案:【background-color】
3、单选题:为了标识一个HTML文件开始应该使用的HTML标记是 ( )。
A:<html>
B:<a>
C:<body>
D:<table>
正确答案:【<html>】
4、单选题:在HTML中,单元格的标记是( )。
A:<span>
B:<tr>
C:<td>
D:<body>
正确答案:【<td>】
5、单选题:CSS 中的选择器不包括包括()
A:元素选择器
B:类选择器
C:ID选择器
D:超文本标记选择器
正确答案:【超文本标记选择器】
6、单选题:( )是网页与网页之间联系的纽带,也是网页的重要特色。
A:导航条
B:框架
C:超链接
D:表格
正确答案:【超链接】
7、单选题:在HTML中,下面是段落标签的是:() 。
A:<p></p>
B:<body></body>
C:<head></head>
D:<html></html>
正确答案:【<p></p>】
8、单选题:()标签可以应用于〈head〉中。
A:<image>
B:<body>
C:<html>
D:<title>
正确答案:【<title>】
9、单选题:下列哪一项是css添加背景图片的正确语法构成?()
A:background-position
B:background-image
C:background-color
D:background-size
正确答案:【background-image】
10、单选题:在HTML开发中,制作网站时首先需要考虑内容是( )
A:页面布局
B:文字字体第四章
C:页面内容
D:图片色彩
正确答案:【页面布局】
第四章 单元测试
1、单选题:HTTPError 是 URLError 的子类,专门用来处理 HTTP 请求错误,比如认证请求失败等。它有 3 个属性,下列选项哪一个不是它的属性()。
A:headers
B:code
C:Response
D:reason
正确答案:【Response】
2、单选题:下列属于HTTP必须实现的请求方法的是()。
A:OPTIONS和CONNECT
B:TRACE和OPTIONS
C:POST与DELE
D:GET与HEAD
正确答案:【GET与HEAD】
3、单选题:下列关于HTTP状态码类型描述错误的是()。
A:3XX表示客户端的请求需采取进一步操作
B:1XX表示请求已被服务器接受,无须后续处理
C:5XX表示服务器可能发生错误
D:4XX表示客户端可能发生错误
正确答案:【1XX表示请求已被服务器接受,无须后续处理】
4、单选题:通过加入特定的____,可以将爬虫发出的请求伪装成浏览器。()
A:User_Agent
B:Headers
C:Request
D:opener
正确答案:【User_Agent】
5、判断题:urlopen方法中的data 参数可以不是 bytes 类型。()
A:对
B:错
正确答案:【错】
6、判断题:requests库中的requests.get(url)方法是请求目标网站,类型是一个HTTPresponse类型。()
A:对
B:错
正确答案:【对】
7、判断题:如果访问某网站的频率太高,则这个网站可能会禁止访问。()
A:对
B:错
正确答案:【对】
8、判断题:requests库中的requests.get(url)方法中包括两个(对象)请求,其中一个为Request请求,即向服务器请求资源的request对象,第二个是Response请求,即包含从服务器返回的所有资源。()
A:错
B:对
正确答案:【对】
9、判断题:Response类用于动态地响应客户端的请求,控制发送给用户的信息,并且将动态地生成响应,包括状态码、网页的内容等。()
A:对
B:错
正确答案:【对】
第五章 单元测试
1、单选题:下列不属于HTTP请求过程的是()。
A:生成请求
B:搜索文档
C:超时设置
D:请求重定向
正确答案:【搜索文档】
如有任何疑问请及时联系QQ 50895809反馈