一、 名词解释(共4题,每题5分,共计20分) 1、 大数据概念及特征 2、 大数据采集 3、 大数据预处理 4、 大数据存储 二、简答题(共3题,每题10分,共计30分) 1、请简述常见大数据采集方法 2、请简述常见大数据采集工具和平台 3、请简述常见大数据预处理方法 三、简述题(共2题,每题10分,共20分)
1、请简述ETL(Extract-Transform-Load)过程中的主要环节。 2、请简述NoSQL特点和NoSQL四大分类。 四、论述题(共2题,每题15分,共30分) 1、请简述医疗非结构化数据、医疗半结构化数据和医疗结构化数据预处理的异同。 2、运用大数据采集与处理技术,请设计中医药政策大数据平台并简述关键步骤和功能。
|