2019年西南财经大学大数据管理专业真题回忆(817).docx
新祥旭考研官网 http:/www.xxxedu.net/1, 名词 解释:5*5 分半监督学习,决策树,关联规则,贝叶斯(大纲没要求 ),自然语言处理二,简答题 5*20 分1.详细的题干是 :假定你是 Big-University 的软件工程师,任务是设计一个数据挖掘系统,分析学学校课程 数据库。该数据库包括如下信息: 每个学生的姓名、地址和状态(例如,本科生或研究生)、所修 课程,以及他们的 GPA。描述你要选取的结构, 该结构的每个成分的作用是什么?给了一个关于课程的数据库,包括学生信息,课程信息,GPA 等数据。设计数据挖掘过程,选择什么结构(这题 没看懂让干啥)2.课本上关于年 龄的那个课后 题最低 13,最高 70,有 27 个数的那个题。找出离群点,写出光滑数据的方法3.写三种处理缺失 值的方法4.少量数据在高密度的区域,大量数据在低密度的区域,使用基于密度的方法只能识别出高密度的区域。这是对这种方法的合理使用吗?如何改进?5.简述基于密度的聚 类方法三,编程计算题 25 分写出将 N 个自然数有序排列的算法思路,并写出任意一种语言的具体程序我对题型不一样是有心理准备的,去年就不一样。没想到有些题会和大纲也不一样。如果你打算考,希望你有心理准备。自己的吐槽: 最后 25 分的编程写算法的题大纲里没有,参考书里也没有讲。还有两个名词解释题书里有但是今年的大纲给去掉了。老师为什么不按自己给的大纲来?我没学过编程,但是如果你把编程写到大纲里我会去学,或者我就不考你这门课了。专业课我确定有 85 分的题是大 纲有的,都会写,就看老师怎么给分了,其他的基本不会。真想把大纲默写到卷子后面,让老师看看哪里写着要会写算法了?75+70+130+85,不知道能不能过线新祥旭考研官网 http:/www.xxxedu.net/看到专业课的卷子有点崩溃。虽然前三门没有考的特别好,但我觉得专业课考个 100 左右都能过线吧。复习专业课翻烂了两份打印的大纲,我尽力了。