《大数据概论》(课程代码:13420)课程考试大纲
课程代码:13420
课程名称:大数据概论
所属专业:530302 大数据与会计(专科)
课程对应教材版本:
《大数据基础与应用(第2版)》(罗少甫主编,北京邮电出版社,2021年版)
高等教育自学考试是对自学者进行的以学历教育为主的国家考试,是个人自学、社会助学和国家考试相结合的高等教育形式。按照自学考试课程命题的有关规定,制定本大纲。
一、课程性质和考试目标
1.课程性质
本课程是高等教育自学考试大数据相关专业的专业课程之一,该课程是大数据相关专业课程体系中的基础课程之一。
《大数据概论》是一门综合性和实践性很强的课程,根据培养应用型人材的需要,本课程的目的与任务是使学生通过本课程的学习,了解大数据基本涵盖内容,掌握大数据分析的传统方法和最新方法, 为更深入地学习和今后从事大数据相关工作打下良好的基础。
2.考试目标
通过自学和考试,使自学者比较全面系统地掌握大数据概论基本理论、基本知识,并联系实际强化训练,加强学生实践动手能力、独立思量问题和解决 问题的能力,达到正确灵便地利用操作系统各知识点来解决相关问题的目标,并为后续专业基础课程、专业课程的学习奠定扎实的基础。
二、考试内容和考核要求
本课程的考试内容:
第一章 “初识大数据”需要掌握:大数据发展历程、处理过程,大数据的特征、数据类型和系统,大数据分析工具,大数据关键技术和关键问题。
第二章 “Hadoop基础”需要掌握: Hadoop的主要特点,Hadoop HDFS原理和结构、Hadoop安装配置以及Hadoop 应用场景。
第三章 “HDFS应用”需要掌握:HDFS 命令行常用接口,数据流读取与写入, HDFS基本操作;并通过编程实现数据的读写及目录管理。
第四章 “MapReduce分布式编程应用开发”需要掌握:开发环境配置管理, MapReduce架构及工作原理,MapReduce设计方法;MapReduce配置和应用、Spark核心概念及与MapReduce的区别。
第五章 “大数据搜索技术”需要掌握:搜索引擎的发展历程,搜索引擎组成,以及搜索引擎工作过程,搜索引擎性能指标,垂直搜索引擎的特点以及搜索引擎基本应用。
第六章 “大数据存储”需要掌握:关系型数据库、列式数据库、键值存储、文档存储和图像数据库五大存储模型;大数据存储主要问题及应对措施;数据常用存储方式以及存储新技术;分布式存储的概念、关键技术和分类;云存储系统的结构模型、分类和安全问题。
第七章 “大数据分析和挖掘”需要掌握:数据仓库及其特点;大数据挖掘及其算法分类;大数据对思维方式的影响;大数据分析方法及应用。
第八章 “大数据的可视化”需要掌握:可视化的发展及其特点;可视化方法及展现方式;ECXEL可视化实现;数据整理步骤和常见统计量以及Tableau基本应用。
第九章 “大数据安全”需要掌握:数据安全要素;物理安全,网络安全以及应用安全措施;大数据安全机制及防护技术;云安全的问题。
三、考试范围和考试说明
坚持质量标准,注重能力考查,使考试合格者能达到一般普通高等学校同专业同课程的结业水平,并体现自学考试以培养应用型人才为主要目标的特点。
1.考试依据和范围
(1)以本课程自学考试大纲为考试依据。附件自学考试指导委员会指定的统编教材为。
(2)考试必读教材:《大数据基础与应用(第2版)》(罗少甫主编,北京邮电出版社,2021年版)。
2.本课程考核的知识与能力的关系
《大数据概论》课程考试,应考核应考者的基本理论、基本知识和基本技能,以及联系实际、运用所学的理论分析问题和解决问题的能力,确保考试合格者达到全日制普通高等学校本专业相同课程的结业水平。
考试工作应引导社会助学者全面系统地进行辅导,引导应考者认真、全面地学习指定教材,系统掌握本学科知识,培养和提高运用知识和技能、分析和解决问题的能力。
3.重点与覆盖的关系
试题覆盖到各章,重点章节的内容占试卷内容比例为50-60%。
四、考试形式和试卷结构
1.考试形式为闭卷笔试,答卷时间为150分钟,采用百分制,60分为及格线。
2.考试的题型有:单项选择题、多项选择题、判断选择题、简答题、论述题。
3.本课程在试题中不同难度要求的分数比例为:容易20%,较易35%,较难35%,难10%。
4.本课程在试题中对不同能力层次要求的分数比例为:识记占20%,领会占30%;简单应用占30%;综合应用占20%。
5.本门课程有无特殊要求(包括考生可携带的工具):无。
五、《大数据概论》课程题型举例
1.单项选择题(在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填在题后的括号内。错选、多选或未选均无分)
(1)大数据环境下的隐私担忧,主要表现为()。
A.个人信息的被识别与暴露
B.用户画像的生成
C.恶意广告的推送
D.病毒入侵
(2)默认情况下,HDFS块的大小为()MB。
A.512
B.128
C.64
- 32
2.多选题
(1)目前来说,以下选项是解决数据集成的主要难题的是。
A、异构性
B、分布性
C、自治性
(2)数据挖掘常用算法有()
A、分类
B、聚类
C、特征分析
D、决策树归纳法
- 3.判断题
1.HDFS是一种分布式文件系统。
2.云存储不能实现存储容量弹性扩展。
- 简答题
1、简述大数据存储系统的基本特点有哪些?
2、简述数据可视化有哪些数据类型?
- 论述题
- 1. 从各国的大数据发展战略,你如何看大数据的发展前景?
- 2. 你认为我国的大数据产业怎么发展?
(2)本站自学考试信息供自考生参考,权威信息以各省(市)考试院官方为准。
暂无评论内容