南开21秋学期《网络爬虫与信息提取》在线作业[正确答案]单选题答案
21秋学期(1709、1803、1809、1903、1909、2003、2009、2103)《网络爬虫与信息提取》在线作业
试卷总分:100 得分:100
一、单选题 (共 20 道试题,共 40 分)
1.Python中线程池map()方法第二个参数是()
A.列表
B.元组
C.字典
D.集合
正确选项:--------
正确选项:--------
2.通过()爬取伪装成异步加载的后端渲染数据
A.正则表达式
B.Json字符串
C.JavaScript
D.Get
正确选项:--------
3.下面Python代码输出为(): def default_para_without_trap(para=[], value=0): if not para: para = [] para.append(value) return para print('第一步:{}'.format(default_para_trap(value=100))) print('第二步:{}'.format(default_para_trap(value=50)))
A.第一步:[100] 第二步:[100,50]
B.第一步:[100] 第二步:[50]
C.第一步:[100] 第二步:[]
D.第一步:[100] 第二步:[100]
正确选项:--------
4.Python中若定义object=(1, 2, 3, 4, 5),则print(object[1:3])输出()
A.12
B.123
C.23
D.234
正确选项:--------
5.在Scrapy的目录下,哪个文件负责数据抓取以后的处理工作?()
A.spiders文件夹
B.item.py
C.pipeline.py
D.settings.py
正确选项:--------
6.浏览器用来记录用户状态信息的数据叫
A.session
B.cookies
C.moonpies
D.selenium
正确选项:--------
7.PyMongo中查询所有age > 29的记录是()
A.collection.find({'age': {'$gt': 29}})
正确选项:--------
B.collection.find({'age'>29})
正确选项:--------
C.collection.find_all({'age': {'$gt': 29}})
正确选项:--------
D.collection.find_all({'age'>29})
8.Redis中往集合中添加数据,使用关键字()
A.sadd
B.add
C.append
D.sappend
正确选项:--------
9.Redis中如果不删除列表中的数据,又要把数据读出来,就需要使用关键字()
正确选项:--------
A.range
B.lrange
C.srange
D.pop
10.在Python中,为了使用XPath,需要安装一个第三方库()
A.lxml
B.xml
C.xpath
D.path
正确选项:--------
11.Python操作CSV文件可通过()容器的方式操作单元格
A.列表
B.元组
C.字典
D.集合
12.某些网站在发起Ajax请求时会携带()字符串用于身份验证
A.Token
B.Cookie
C.ReqTime
D.sum
正确选项:--------
13.PyMongo中逻辑查询表示不等于的符号是()
A.$gt
B.$lt
C.$eq
D.$ne
正确选项:--------
14.下列说法错误的是()
A.Charles只能截获HTTP和HTTPS的数据包,如果网站使用的是websocket或者是flashsocket,那么Charles就无能为力。
B.有一些App会自带证书,使用其他证书都无法正常访问后台接口。在这种情况下,Charles自带的证书就不能正常使用,也就没有办法抓取这种App的数据
C.有一些App的数据经过加密,App接收到数据以后在其内部进行解密。Charles无法获取这种App的数据
D.对于上述情况,Charles能抓取到经过加密的数据。但是如果无法知道数据的具体加密方法,就没有办法解读Charles抓取到的数据。
正确选项:--------
15.使用Xpath获取文本使用()
A.text
B.text()
C.content
D.content()
16.启动MongoDB使用命令mongod --() usr/local/etc/mongod.conf
正确选项:--------
A.config
B.install
C.start
D.begin
17.Redis中查看一个列表长度,使用关键字()
正确选项:--------
A.len
B.length
C.llen
D.count
18.Python中若定义object="12345",则print(object[::-1])输出()
A.1
B.5
C.54321
D.程序报错
正确选项:--------
19.在Scrapy的目录下,哪个文件负责存放爬虫的各种配置信息?()
A.spiders文件夹
B.item.py
C.pipeline.py
D.settings.py
20.当爬虫运行到yield scrapy.Request()或者yield item的时候,下列哪个爬虫中间件的方法被调用?
A.process_spider_output()
正确选项:--------
B.process_spider_exception()
C.process_spider_input()
正确选项:--------
D.process_start_ requests()
南开21秋学期《网络爬虫与信息提取》在线作业[正确答案]多选题答案
二、多选题 (共 10 道试题,共 20 分)
21.在配置ios使用Charles的操作中,正确的有()
A.对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。
B.选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888
正确选项:--------
C.输入完成代理以后按下苹果设备的Home键,设置就会自动保存。
D.安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任
正确选项:--------
22.下载器中间件的作用有哪些?
A.更换代理IP
B.更换Cookies
C.更换User-Agent
D.自动重试
正确选项:--------
23.下列关于在IOS上配置charles的说法正确的是()
A.不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。
B.手机和电脑需要在同一个局域网下。
C.HTTP代理可以使用“自动”选项。
正确选项:--------
D.安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动
正确选项:--------
24.如果爬虫爬取的是商业网站,并且目标网站使用了反爬虫机制,那么强行突破反爬虫机制可能构成()
A.非法侵入计算机系统罪
B.非法获取计算机信息系统数据罪
C.非法获取计算机数据罪
D.非法获取系统罪
正确选项:--------
25.Python中一个函数没有返回值则可以写()
A.没有return
B.return
C.return None
D.return NULL
26.使用BeautifulSoup对象后可以使用()来查找内容
A.find_all
正确选项:--------
B.find
C.search
D.search_all
正确选项:--------
27.PyMongo删除操作有()
A.delete
B.delete_all
正确选项:--------
C.delete_one
正确选项:--------
D.delete_many
28.以下哪些方法属于Python写CSV文件的方法()
A.writeheaders
B.writeheader
C.writerrows
D.writerow
29.MongoDB中获取名字为db的库的语句为()
正确选项:--------
A.client.db
B.client('db')
C.client['db']
D.client{'db'}
正确选项:--------
30.Python中()容器有推导式
A.列表
B.元组
C.字典
D.集合
三、判断题 (共 20 道试题,共 40 分)
31.中间人攻击也是抓包的一种。
32.在请求头中设置User-Agent即可正常请求网站
33.UI Automator Viewer与Python uiautomator可以同时使用
34.device.sleep()方法是使用UI Automatorr关闭屏幕的命令
35.爬虫的源代码通过公开不会对被爬虫网站造成影响
36.虽然MongoDB相比于MySQL来说,速度快了很多,但是频繁读写MongoDB还是会严重拖慢程序的执行速度。
正确选项:--------
37.打码平台都是靠机器使用OCR技术识别图片上的文字。
38.Python中包含字典的列表页可以转换成JSON字符串
39.需要实名认证的打码网站更加安全可靠。
40.MongoDB URI的格式为: mongodb://服务器IP或域名:端口@用户名:密码
41.MongoDB中ObjectId可以反向恢复为时间
正确选项:--------
42.验证码必须通过手动填充识别。
43.使用UI Automatorr操作实体键的命令为device.press.实体按键名称()
正确选项:--------
44.在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务 src/redis-server
45.开源库pytesseract的作用是将图像中文字转换为文本。
46.Redis的集合与Python的集合一样,没有顺序,值不重复
正确选项:--------
47.mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本
正确选项:--------
48.process_spider_input(response, spider)是在爬虫运行yield item或者yield scrapy.Request()的时候调用
正确选项:--------
49.上课传纸条。A要把纸条传给B,但是A与B距离太远,于是让C来转交纸条。此时,C先篡改纸条的内容再传给B,这是一种类似抓包的方式。
南开21秋学期《网络爬虫与信息提取》在线作业[正确答案]奥鹏资讯分享:
计算机科学与技术专业培养具有良好科学素养,系统地掌握计算机科学与技术的基础理论、基本技能与方法,具备现代计算机专业知识,有较强的获取新知识的能力、创新能力和实践能力,能从事计算机系统设计与开发、计算机应用和技术经济管理等方面工作的技术人才。远程教育的学习便捷、自由安排的方式,受到越来越多在职学历提升考生的报考选择。那计算机科学与技术专升本学校有哪些?计算机科学与技术专升本考什么科目?计算机科学与技术专升本有什么报考流程?...计算机科学与技术专升本考生都知道这些答案吗?接下来本文将详细说说这些考生关心的疑问。
计算机科学与技术专升本学校有哪些?
目前开设且招生计算机科学与技术专业专升本的远程教育学校有中国人民大学、北京交通大学、北京理工大学、北京邮电大学、北京外国语大学、北京语言大学、南开大学、天津大学、大连理工大学、东北大学、吉林大学、东北师范大学、东北农业大学、江南大学、福建师范大学、华中师范大学、西南交通大学、电子科技大学、四川农业大学、西南大学、西安交通大学、西北工业大学、兰州大学、中国石油大学(华东)、中国地质大学(北京)、四川大学、中国石油大学(北京)等和广东开放大学、云南开放大学,计算机科学与技术远程教育专升本招生院校都是教育部批准远程教育试点的高校,也是国内著名的重点大学,为在职专升本考生提供学历教育,提供学历提升机会,也培养输出优质的专业高级人才。
计算机科学与技术专升本远程教育学历是国家承认、学信网可查的,可用在升职加薪、找工作、出国留学、考研、公考、落户积分、职业资格证书考试、职称评级等方面,计算机科学与技术专升本远程教育学历含金量是非常可观的。
计算机科学与技术专升本考生可通过计算机科学与技术专升本了解报考院校专业的招生详细介绍。
计算机科学与技术专升本考什么科目?
计算机科学与技术远程教育专升本考试科目一般有入学测试科目、课程学习考试科目和专升本统考考试科目。
1、计算机科学与技术远程教育专升本招生院校都是自主命题,自行组织考试,而非经过成人高考那样全国统一考试。远程教育院校组织的计算机科学与技术专升本考试主要考查学生是否具备相应的学习能力,能够自主完成学习计划而毕业等,相对成人高考专升本考试,计算机科学与技术远程教育专升本考试难度比较简单,容易通过。
因报考院校不同计算机科学与技术专升本考生面对的远程教育入学测试题考试科目有所不同。考生以报考院校招生规定为准。比如:东北师范大学计算机科学与技术专升本远程教育入学测试科目:
层次
招生专业
科类
考试科目
学位类型
学分
学习期限
专升本
计算机科学与技术
文理科
基础知识测试(语文、英语)专业知识测试(专业课)
理学
80 2.5--6年计算机科学与技术专升本考生可通过奥鹏教育官网——服务大厅——入学测试模拟题下载,下载报考院校的相应入学测试模拟题进行考前复习准备。
2、计算机科学与技术远程教育专升本课程学习科目有招生院校根据专业学习计划安排授课内容,报考不同院校所学课程可能略有差别,以南开大学计算机科学与技术专升本远程教育课程学习设置为例:
层次
专业
核心课程
专升本
计算机科学与技术