数据思考与练习
一、单选题
1.当前大数据技术的基础是由( )首先提出的。
2021消防员招录平台
A.微软  B.百度  C河南省教育考试院档案状态.谷歌  D.阿里巴巴
2.大数据的起源是( )。
A.金融  B.电信  C.互联网  D.公共管理
3.智能健康手环的应用开发,体现了( )的数据采集技术的应用。
A.统计报表  B.网络爬虫  C.API接口  D.传感器
4.2012年,( )政府发布了《大数据研究和发展倡议》,标志着大数据已经成为重要的时代特征。
A.中国  B.美国  C.日本  D.英国
5.大数据的最显著特征是( )。
A.数据规模大  B.数据类型多样  C.数据处理速度快  D.数据价值密度高
6.下列关于大数据特点的说法中,错误的是( )。
A.数据规模大  B.数据类型多样  C.数据处理速度快  D.数据价值密度高
7.当前社会中,最为突出的大数据环境是( )。
A.互联网  B.物联网  C.综合国力  D.自然资源
8.医疗健康数据的基本情况不包括以下哪项?( )
A.诊疗数据  B.个人健康管理数据  C.健康档案数据 D.公共安全数据
8.下列关于计算机存储容量单位的说法中,错误的是( )。
A.1KB<1MB<1GB  B.基本单位是字节(Byte)
C.一个汉字需要一个字节的存储空间  D.一个字节能够容纳一个英文字符
9.在数据生命周期管理实践中,( )是执行方法。
A.数据存储和备份规范 B.数据管理和维护
C全国英语四级.数据价值发觉和利用  D.数据应用开发和管理
10.大数据时代,数据使用的关键是( )。
A.数据收集  B.数据存储  C.数据分析  D.数据再利用
11.大数据的本质是( )
A.联系  B.挖掘 C.洞察  D.搜集
12.规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是( )。
A.大数据  B.贫数据  C.富数据  D.繁数据
13.信息技术的发展非常快,表现在( )。
A.集成电路的规模每1824个月翻一倍
B.信息的存储能力每9个月翻一番
社工证考试报名C.信息的存储能力每9个月翻一番
D.光通讯的速率和容量每年翻一番
14.与大数据密切相关的技术是( )。
A.蓝牙  B.云计算  C.博弈论  D.WiFi
15.大数据应用需依托的新技术有(
A.大规模存储与计算   B.数据分析处理   C.智能化 D.三个选项都是
16.数据科学就是从( )中提取知识的研究。
A.流量  B.互联网 C.数据  D.人
17.IBM在3V的基础上又归纳总结了第4个V是指( )。
A.真实和准确  B.无时不在  C.巨量  D.极速
18.IDC的定义除了揭示大数据传统3V基本特征,即Volume、Variety和Velocity,还增添了一个新特征是( ),也称4V特征。
A.量大  B.速度快  C.应用广 D.价值
19.大数据的( )动态性体现在大数据是基于互联网的实时动态数据,而不是历史的或严格控制环境下产生的内容。
A.社会性  B.广泛性  C.公开性 D.动态性
20.( )数据的最大特点是表现为以行、列组成的二维形式。
A.结构化  B.半结构化  C.准结构化  D.非结构化
21.大数据处理的处理过程首先是( )。
A.大数据存储及管理  B.大数据展现应用  C.大数据集处理  D.大数据采集
22.由于大数据要处理大量、非结构化的数据,所以在各处理环节中都可以采用( )处理。
A.串行  B.并行  C.逻辑  D.科学
23.数据( )和数据( )是大数据分析的基础。
A.质量  B.管理  C.数量  D.规模
24.大数据分析和处理通常分为离线数据分析和在线数据分析。当前的离线数据分析通常构建在( )平台之上。
A.科学  B.数据  C.云计算  D.网络
25.大数据分析的理论核心就是( )算法
A.聚类分析  B.科学计算  C.云计算  D.数据挖掘
二、多选题
1.在网络爬虫的爬行策略中,应用最为基础的应用是( )。
A.深度优先遍历策略
B.广度优先遍历策略
C.高度优先遍历策略
D.反向链接策略
E.大站优先策略
2.当前,大数据产业发展的特点是( )。
A.规模较大 B.规模较小 C.增速很快 D.增速缓慢 E.多产业交叉融合
3.大数据人才整体上需要具备( )等核心知识。
A.数学与统计知识
B.计算机相关知识
C.马克思主义哲学知识
D.市场运营管理知识
E.在特定业务领域的知识
4.对大数据的管理和使用包括哪些方面?( )
A.大数据的应用  B.大数据的存储  C.大数据的运营  D.大数据的挖掘
5.信息技术主要包括( )。
A.通信技术  B.计算机技术  C.传感技术  D.微电子技术
6.以下说法正确的有哪些?( )
A.机器的智能方式和人是完全一样的
B.机器的智能方式是结果导向的
C.机器的智能方式和人的智能不同
D.机器产生智能的方式是通过数据、数学模型
7.大数据作为一种数据集合,它的含义包括( )。
A.数据很大  B.变化很快  C.很有价值 D.构成复杂
8.大数据的主要特征表现为( )。
A.商业价值高 B.数据类型多 C.处理速度快 D.数据容量大
9.信息社会经历的发展阶段包括( )。
A.大数据时代 B.计算机时代 C.互联网时代 D.云计算时代
10.当前大数据产业发展的特点是(
A.规模较大  B.规模较小  C.增速很快  D.增速缓慢  E.多产业交叉融合
11.大数据的价值体现在( )。
A.大数据给思维方式带来了冲击
B.大数据为政策制定提供科学论据
C.大数据助力智慧城市提升公共服务水平
D.大数据实现了精准营销
E.大数据的发力点在于预测
12.当前大数据技术的基础包括( )。
A.分布式文件系统
B.分布式并行计算
C.关系型数据库
D.分布式数据库
13.下列关于计算机存储容量单位换算关系的公式中,正确的是( )
A.1KB=1012Byte
B.1KB=1024Byte 
C.1GB=1024KB 
D.1GB=1012KB 
E.1GB=1024MB
14.IBM公司用3个V来描述大数据的三个基本特征,这3V是( )。
A.体量 B.规模 C.速度 D.多样性 E.复杂性
15.下列关于云计算和数据库的说法中,错误的是( )。
A.获取样本的代价很高
B.获取足够大的样本数据乃至全体数据非常容易
C.比抽样调查数据更全面
D.比抽样调查更能反映整个体的特征与规律
E.可以为发现新的商业机会提供决策支持
16.从大数据的不同定义,可以总结其( )两点共性。
A.大数据的数据量标准是随着计算机软硬件的发展而不断增长的。
B.大数据无人不知。
C.大数据不仅体现在数据规模上,更体现在技术上。
D.大数据不分国界。
17.大数据的主要来源包括( )。
A.图片  B.网页  C.视频  D.传统数据库
18.大数据基础架构构建为堆栈式技术架构,包括( )。
A.基础层  B.管理层  C.分析层  D.挖掘层  E.应用层
19.大数据时代的基本特征主要体现在( )等几个方面。
A.社会性  B.广泛性  C.公开性  D.动态性
20.(  )等信息是没有固定结构的数据属非结构化数据,(    )等一些纯文本数据属半结构化数据。
A.图片  B.邮件  C.咅频 D.视频 E.员工简历
三、判断题(无F则对)
1.对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。F
2.一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。
3.大数据的思维会把原来销售的概念变成服务的概念。
4.2015831日,国务院印发了《促进大数据发展行动纲要》。
5.数据可视化可以便于人们对数据的理解。
6.大数据技术和云计算技术是两门完全不相关的技术。F
7.当前,企业提供的大数据解决方案大多基于Hadoop 开源项目。
8.数据科学家能够从堆积如山的大量数据中到金矿,并将其价值以易懂的形式传达给决策者,最终得以在业务上实现。
9.数据价值密度的高低与数据总量的大小成反比。
10.在大数据时代,我们无须再紧盯事物之间的因果关系。
11.大数据既能告诉我们“是什么”,也能告诉我们“为什么”。F
12.数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。
13.大数据应用的关键与必要条件,就在于“IT技术”与“经营”的融合。
四、填空题
1.大数据最具潜能的三大应用领域分别为商业智能、公共服务和_ 市场营销__
2.1pb=(_ 1024__)tb=(_ _2e20_)gb=(_ 2e30__)mb=(_ 2e40__)kb
3.大数据的4v特征分别是  大量化    多样化    快速化  和 价值密度低。
云南省考历年笔试成绩4.数据产生和_ 更新__的频率,是大数据区别于传统数据的最显著特征。
5.大数据时代的根本特征就是能够从任何_数据__中获得有价值的知识。
6.大数据的动态一是指数据资料的_收集 __具有动态性,二是指处理数据的_工具 __也具有动态性。
7.大数据时代的重要变革体现在_ 数据__从在以前不被重视,到现在被视为资产。
8.大数据的结构类型主要有_结构化 __、半结构化、准结构化和_ 非结构化__2016国考申论答案4种。
9.大数据技术是从各种类型的_数据 __中快速获得有价值信息的技术。
10.在大数据的生命周期中,数据采集处于第_ __个环节。
11.要对采集的大数据进行有效分析,应将这些数据导入到一个集中的大型_分布式 __数据库或存储集。
12.对采集的大数据进行有效分析,应将这些数据导入到数据库或存储集,并且在导入基础上做_ 抽取___清洗 __的预处理工作。