欢迎光临
奥鹏作业辅导

南开19春学期(1709 、1803、1809、1903)《网络爬虫与信息提取》在线作业[答案]

来源:奥鹏远程教育   日期: 作者:奥鹏作业辅导

南开19春学期(1709 、1803、1809、1903)《网络爬虫与信息提取》在线作业[答案]满分答案

19春学期(1709 、1803、1809、1903)《网络爬虫与信息提取》在线作业-0003

试卷总分:100    得分:0

一、 单选题 (共 20 道试题,共 40 分)

1.使用Xpath获取文本使用()

A.text

B.text()

C.content

D.content()

 

 

2.Redis是()数据库

A.关系数据库

B.键值数据库

C.列存数据库

D.图数据库

 

 

3.Redis是一个开源的使用()语言编写

A.ANSI C

B.C++

C.JAVA

D.Python

 

 

4.Python中Object={'obj_1':'1','obj_2':'2'},则Objcet.get('boj_1','3')是()

A.1

B.2

C.3

D.无输出

 

 

5.使用Xpath构造相同字符串开头的路径采用()方法

A.starts-with

B.starts

C.begin

D.begin-with

 

 

6.使用UI Automator打开微信的操作是获取相应图标后使用命令()

A.touch

B.click

C.push

D.hover

 

 

7.在Scrapy工程的settings.py文件中,哪个配置项,如果设置为True,那么Scrapy就会自动跳过网站不允许爬取的内容()

A.ROBOTSTXT_ OBEY

B.ROBOTSTXT_JUDGE

C.ROBOTSTXT

D.ROBOTSTXT_ IF

 

 

8.以下哪个命令是创建文件夹命令()

A.curl

B.tar -zxvf

C.mkdir

D.cp

 

 

9.Python写CSV文件需要哪个方法()

A.CSVWriter

B.CsvWriter

C.DictWriter

D.FileWriter

 

 

10.PyMongo中逻辑查询表示不等于的符号是()

A.$gt

B.$lt

C.$eq$$ne

 

 

11.python中可以用来将图片中的文字转换为文本的第三方类库是

A.lxml

B.requests

C.beautifulsoup

D.pytesseract

 

 

12.PyMongo中逻辑查询表示等于的符号是()

A.$gt

B.$lt

C.$eq$$ne

 

 

13.下面代码一共执行循环多少次(): i=0 while i<10: i+=1

A.9

B.10

C.11#0

 

 

14.Redis中往集合中添加数据,使用关键字()

A.sadd

B.add

C.append

D.sappend

 

 

15.如果使用Python的数据结构来做类比的话,MongoDB中集合相当于一个()

A.列表

B.元组

C.字典

D.集合

 

 

16.以下哪个HTML标签表示定义无序列表()

A.

B.

C.

D.

 

 

17.使用UI Automatorr判断元素是否存在的操作是得到相应控件后使用命令()

A.exist

B.exists

C.isnull

D.contains

 

 

18.MongoDB中数据存储的形式类似于()

A.列表

B.元组

C.字典

D.集合

 

 

19.执行下面代码,结果为(): name_list = [] if name_list and name_list[100] == '张三': print('OK')

A.程序报错

B.OK

C.NULL

D.无输出

 

 

20.HTTP常用状态码表明服务器内部资源出故障了的是()

A.500

B.503

C.403

D.404

 

 

南开19春学期(1709 、1803、1809、1903)《网络爬虫与信息提取》在线作业[答案]多选题答案

二、 多选题 (共 10 道试题,共 20 分)

1.HTTP常用状态码表明表明浏览器需要执行某些特殊的处理以正确处理请求的有()

A.200

B.301

C.302

D.204

 

 

2.以下哪种方法是MongoDB的查找方法()

A.find

B.find_one

C.finds

D.find_all

 

 

3.Python中的容器有()

A.列表

B.元组

C.字典

D.集合

 

 

4.Python中通过Key来从字典object中读取对应的Value的方法有()

A.object[key]

B.object.get(key)

C.object.pop(key)

D.object.pop()

 

 

5.Python中一个函数没有返回值则可以写()

A.没有return

B.return

C.return None

D.return NULL

 

 

6.为了解决爬虫代码本身的错误引起的异常,可以采用下列哪些方法

A.仔细检查代码

B.开发爬虫中间件

C.开发下载器中间件

D.等待

 

 

7.以下哪些方法属于Python写CSV文件的方法()

A.writeheaders

B.writeheader

C.writerrows

D.writerow

 

 

8.以下HTTP状态码表示服务器本身发生错误的是

A.400

B.503

C.302

D.500

 

 

9.以下哪些可以独立成为Python编译器()

A.Pycharm

B.IDLE

C.Eclipse

D.Visual Studio 2010

 

 

10.PyMongo删除操作有()

A.delete

B.delete_all

C.delete_one

D.delete_many

 

 

三、 判断题 (共 20 道试题,共 40 分)

1.需要实名认证的打码网站更加安全可靠。

A.对

B.错

 

 

2.当使用Scarpy创建爬虫时,当爬取网易云音乐首页信息时,scrapy genspider的第二个参数直接输入"163.com"就可以了

A.对

B.错

 

 

3.如果目标网站本身就是提供公众查询服务的网站,那么使用爬虫是合法合规的。

A.对

B.错

 

 

4.PyMongoDB中排序方法sort第二个参数1表示降序

A.对

B.错

 

 

5.在安装Scarpy的依赖库时,由于Visual C++ Build Tools的安装速度很慢,为了节省时间,可以和安装Twisted同时进行

A.对

B.错

 

 

6.默认情况下,MongoDB可以通过外网访问

A.对

B.错

 

 

7.HTTP状态码302与307完全同义。

A.对

B.错

 

 

8.在请求头中设置User-Agent即可正常请求网站

A.对

B.错

 

 

9.MongoDB URI的格式为: mongodb://服务器IP或域名:端口@用户名:密码

A.对

B.错

 

 

10.爬虫登录需要识别验证码可以先把程序关闭,肉眼识别以后再重新运行

A.对

B.错

 

 

11.引用中间件时后面的数字代表的是中间件的执行顺序,例如 'AdvanceSpider.middlewares.ProxyMiddleware': 543 中的543

A.对

B.错

 

 

12.robots.txt是一种规范,在法律范畴内

A.对

B.错

 

 

13.Python正则表达式中“.*?”是非贪婪模式,获取最短的能满足条件的字符串。

A.对

B.错

 

 

14.Scrapy的工程名字不能使用"scrapy",否则爬虫会无法运行。除此以外工程名不受限制。

A.对

B.错

 

 

15.虽然MongoDB相比于MySQL来说,速度快了很多,但是频繁读写MongoDB还是会严重拖慢程序的执行速度。

A.对

B.错

 

 

16.爬虫的源代码通过公开不会对被爬虫网站造成影响

A.对

B.错

 

 

17.插入数据时,MongoDB会自动添加一列“_id”,也就是自增ID,每次自动加1

A.对

B.错

 

 

18.数据抓包就是中间人爬虫的一个简单应用。所以使用Charles也是一种中间人攻击

A.对

B.错

 

 

19.使用Charles,可以轻松截获手机App和微信小程序的数据包,从而开发出直接抓取App后台和小程序后台的爬虫。

A.对

B.错

 

 

20.Redis插入数据都是插入到列表右侧,因此读取数据也是从右侧读取

A.对

B.错

 

南开19春学期(1709 、1803、1809、1903)《网络爬虫与信息提取》在线作业[答案]历年参考题目如下:

本文标签: 南开 学期 网络爬虫 
扫描二维码获取答案

热门文章

猜你喜欢

  • 南开18春学期《市政学》在线作业答案

  • 18春学期《市政学》在线作业-0002 试卷总分:100 得分:0 一、 单选题 (共 20 道试题,共 40 分) 1.一下特征中,()不属于我国城市化的主要特征 A.政府主导的城市化
  • 北语21春《审计学》作业1[答案]奥鹏作业

  • 21春《审计学》作业1 试卷总分:100 得分:100 一、单选题 (共 18 道试题,共 90 分) 1.注册会计师获取的下列以文件记录形式的证据中,证明力最强的是_____。 A
  • 股票股利是指()。

  • 股票股利是指()。 A.用资本公积发放的股利 B.用增发股票分配的利润 C.用债券发放的股利 D.以上都不是 答案:B
  • 19春华师《西方经济学》在线作业[答案]

  • 华师《西方经济学》在线作业-0003 试卷总分:100 得分:0 一、 单选题 (共 10 道试题,共 30 分) 1.对通货膨胀现象最恰当的描述是( ) A.流通中的货币量过多而引起