奥鹏答案网-奥鹏作业答案-奥鹏在线作业答案-奥鹏离线作业答案-奥鹏毕业论文-专业奥鹏作业答案辅导网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 444|回复: 0

[南开大学]20春学期《数据分析》在线作业(答案100分)

[复制链接]

2万

主题

2万

帖子

6万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
64471
发表于 2021-3-22 15:49:01 | 显示全部楼层 |阅读模式

[南开大学]20春学期(1709、1803、1809、1903、1909、2003)《数据分析》在线作业% ~6 A* u8 x% D. d
试卷总分:100    得分:100  L, |9 |+ p0 Q( ~: y5 T
第1题,任何故意提高网页在搜索引擎结果中的位置,使其与网页的()不相符的行为,称为Web作弊
A、访问量5 K- y. o% x2 H1 B
B、实际价值
C、搜索量
D、用户数量
正确答案:9 f9 c( ^) ~( b( U) I
1 m, o) O0 w' u& ~2 r& R, q' b
! D7 [. t" `9 n4 ?
第2题,最小类间距离是()
A、两类中各个个体距离的最小值* D  q0 H8 s- Y$ ^+ j( Y) |
B、两类中心距离
C、两类所有样本对距离的平均值
D、所有样本对之间距离的平均值
正确答案 [9 t2 w/ M3 v3 `  n: a8 V
+ e) z& q2 H' {4 W+ s& ?7 K' h

第3题,大数据的特点不包含; k: M- C+ W! n3 i- U3 v8 `
A、数据体量大
B、价值密度高
C、处理速度快$ t( z+ f/ E* a( @' k
D、数据不统一
正确答案


第4题,类的Q型聚类是指()# F1 q' \  I6 L1 }# a9 S
A、对样本个体进行聚类
B、对指标变量进行聚类。7 o/ ~2 T1 U' ~0 j( p
正确答案:


答案来源:谋学网(www.mouxue.com),以下哪个会降低Apriori算法的挖掘效率(  )6 _" X4 ?) Q. s( w; i
A、支持度阈值增大/ W& z! y) |) ]0 z0 a7 ?
B、项数减少2 t1 u: N; I, _9 s, z6 s
C、事务数减少
D、减小硬盘读写速率
正确答案
# j" u) B, M5 f' Q- }

第6题,基于MapReduce的Apriori算法,共进行几轮MapReduce()6 _9 _6 i, ?' H
A、1
B、2# Y7 j+ u! ]- I- c
C、3; W  g8 {8 _% p, w6 N
D、4
正确答案:% c% g7 ~# b- A# d

; b" \4 C: {" Y! i9 w
第7题,评价分类器效果时,表示正确分类的样本数与总样本数之比的指标是()。1 l  D8 Z: V6 w6 L& ^
A、准确率
B、精确率
C、召回率
D、F1值6 H. M; A' c; P. k- ]
正确答案:0 O% ~' J7 P" `% \7 A7 @
4 C6 \3 I' e( i
! X4 _0 V. i# t- a
第8题,逻辑斯谛分布的分布函数范围在()$ i" |0 S2 x3 P' C. ]
A、(-∞,+∞)5 \4 `4 e) ]  }6 o7 B
B、(0,1)8 l: Y& _/ X# o; w
C、(-1/2,1/2)
D、(-1,1)( z8 t# w3 H% |. g
正确答案:
! x7 l5 |1 L5 b) C
# B; \) X9 K7 ?2 w, r
第9题,闵式距离参数是()时代表曼哈顿距离
A、08 s; E( \* b, @0 q" z9 _
B、11 ^. i- l$ h, T, F
C、2
D、无穷
正确答案:
/ k0 \" ]3 U! K

答案来源:谋学网(www.mouxue.com),置信度(confidence)是衡量兴趣度度量(  )的指标$ R" Z, J* D4 Q: g
A、简洁性
B、确定性
C、实用性5 `9 x1 S8 A% [3 m2 e& ~, g: z' W
D、新颖性( W3 E0 c4 B7 a; j4 d
正确答案:2 z  M2 g6 D" [) m


第11题,维克托?迈尔-舍恩伯格在《大数据时代:生活、工作与思维的大变革》一书中,持续强调了一个观点:大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下哪个算法直接挖掘()) J4 l/ e7 T6 n; x
A、K-means# V0 ?. E" [' Z
B、Bayes Network. b2 H: W) W' x6 j
C、C4.58 q0 S* R% \" X: Y8 p( Q
D、Apriori
正确答案6 T$ _0 L8 U' p$ }# t

: B5 o0 e) n2 M+ T7 b* V: X
答案来源:谋学网(www.mouxue.com),非频繁模式(  )
A、其置信度小于阈值9 j8 S; p5 A& R+ E0 J: r9 C, q
B、令人不感兴趣3 w6 @$ E( r6 ]
C、包含负模式和负相关模式/ Y& F" W* B1 o0 i  Y5 u
D、对异常数据项敏感! w, w5 D- ?# c( i# T1 u8 X) W
正确答案


第13题,向量空间的度量,表示文本之间的()。1 o3 Z: I- ^' D8 o
A、关系
B、相似度
C、语义关系
D、语义相似度
正确答案
8 R) s. A: k* y& x
/ P8 K! a! @  u& {' Y
第14题,话题向量空间模型中,用()的一个向量表示该文本。& M9 B# C% `( @( X
A、特征词& a0 R$ ?! G0 w- K
B、话题空间
C、语义空间$ @, g4 `. t2 c
D、词向量空间
正确答案 N- P; g8 I5 I6 J

/ j8 X2 g, \- P; d% o; j( G
答案来源:谋学网(www.mouxue.com),朴素贝叶斯中,给定输入x,求解在x出现的前提下各个类别出现的概率,哪个最大,就认为x属于哪个类别。即选择()最大的类别。
A、后验概率
B、先验概率3 w; c* l+ s+ b- _  z7 G* ]; `
C、极大似然估计
正确答案:

: V6 }! K4 e5 d9 c  h2 Z: @1 _
第16题,在文本信息处理系统中,所处理的原始数据是()
A、结构化的自然语言文本" k* h. Q' j' X- S4 a( D+ ?
B、非结构化的自然语言文本- |4 w* Q2 }1 z+ q2 T$ {3 k; F
C、非结构化的编码0 u' n8 @( y# ~% a8 D5 L8 M
D、结构化的编码
正确答案:. s* o. i8 U: _, z& H: G' p- b' L9 P

+ z( U2 y$ u- _
第17题,k近邻法中的分类决策规则往往是()2 K8 O3 s3 L3 v
A、依权重表决
B、多数表决3 f8 `1 I7 u* P& o7 u( j4 d" S
C、前提设定
D、随机决定. f5 q) K# ]" m3 D; u/ V8 n$ s
正确答案 W8 ?& c! g: F( \
, F/ p  {3 V+ e/ t3 r( M* _0 L
6 N7 k' T: `5 A; Q7 E5 F1 j
第18题,数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段(  )。5 ~+ s. n! a$ t6 m* s- T
A、运营式系统阶段
B、用户原创内容阶段
C、感知式系统阶段
正确答案:
; U" U  D' \" a

第19题,支持向量机的MapReduce实现要进行几轮MapReduce(), u7 T0 Y8 b- V! s# m& h  \5 I
A、1
B、21 W% b2 r+ T6 l# o
C、3
D、自行规定& N& J) M6 ?8 ~, m8 b1 q7 b0 Y
正确答案6 L" ~( c- V) K% p! ?
1 |2 `5 _6 h# B. z
( l7 P) P; t/ j# M0 L
答案来源:谋学网(www.mouxue.com),以下属于关联分析的是(  )
A、CPU性能预测
B、购物篮分析
C、自动判断鸢尾花类别
D、股票趋势建模, `+ Z7 q! V- r/ i
正确答案:


第21题,概率潜在语义分析中,模型生成的是(),但观测到的是()。6 n7 j+ b; Y9 R6 ?% e
A、单词-话题-文本三元组0 S% g# d# G/ b  i+ n
B、话题-文本二元组8 e( B* e) F2 B- @
C、单词-话题二元组) e+ G; w. s. j7 Y) O
D、单词-文本二元组
正确答案:,D0 r* i% ^  u6 ^$ A0 X
0 z* [9 ~' J% |: J5 P4 @4 Y
9 H) M! t7 \' W4 N4 ^4 W7 P1 B
第22题,层次方法中,自底向上的方法是哪种()/ {# ^7 _! D0 W# c/ V
A、凝聚法( V3 P2 D; X- u  E# p8 @
B、分裂法% E+ ?  }3 G6 l1 l' B
C、K-均值算法1 P1 M6 b+ p) [5 f2 k
D、K-中心点算法, T4 o$ l9 M; ]# ]
正确答案:,B' W3 U8 z8 t+ J1 S& m  I6 M* H

( S1 a' W& C* a
第23题,聚类方法包括()
A、划分方法! N& Y! [0 q4 L. {0 l7 f. r3 s# K. f
B、层次方法3 O) y$ W& g1 ]% T3 T& Z
C、对象方法
D、基于密度的方法, K! O  i* D) _/ C
正确答案:,B,D- i. o- S7 j" z3 K  \

/ i7 A  Q/ |$ z  Z: I" Z
第24题,统计学习的重要性()
A、统计学习是处理海量数据的有效方法2 ?8 f$ [- L; g7 O
B、统计学习是计算机智能化的有效手段  f' c& V% [2 e; X9 d  d
C、统计学习是计算机科学发展的一个重要组成部分& F% a! j2 X$ ?$ i: ^& s; `0 P
正确答案:,B,C9 E, |4 L; Z& p9 Y% R

) f5 {1 H+ W) J: L! e" I
答案来源:谋学网(www.mouxue.com),聚类的核心是()
A、相似度8 z. T+ C* B0 `& x, Z! l9 y
B、距离& C' S7 E; h1 }5 w
C、特征7 u. w/ _1 Y. V" O9 K
D、数据, y1 `; f* Z) G9 r9 o% r
正确答案:,B' \5 o" L9 z( M5 [. n% S

( l- e/ `' A5 V$ z! Y
第26题,下面哪些属于分类算法()9 C* Z5 ^: U& \$ {& `1 A- m6 n" I
A、SVM, q  P7 k8 u5 s4 C& y
B、决策树% E+ X/ q" ~8 c$ o
C、KMeans( x* L! H5 Z, F* ]7 S7 c; |, I3 o
D、朴素贝叶斯2 H+ V6 y/ Q% c: e# x
正确答案:,B,D% k# J* @' e9 J4 x6 a* g- k
! h# P7 H. D- _# Z
  R1 S3 S( a0 f- a, L
第27题,链接分析是对网络链接的()等各种现象进行分析
A、自身属性
B、链接对象/ S9 t& ]% a+ u3 T* y; P
C、链接网络
正确答案:,B,C: h$ m3 ^6 d& C
: f9 ~, b* ]( |* u  o( E
, w& P: f$ g3 x+ ~# o' @; W
第28题,潜在语义分析中,要同时决定两部分内容,是(),使两者的乘积是原始矩阵数据的近似。3 [! v" w) K9 H) i1 s6 I7 t
A、话题空间
B、文本在话题空间的表示
C、话题维度
D、词向量空间5 p' Z, W9 q& b5 h& \# t
正确答案:,B$ Y; m* e4 `2 Y

+ ?) P. u0 O/ d- r) C8 L+ J
第29题,连续性变量的距离可用以下()方法衡量
A、曼哈顿距离
B、切比雪夫距离
C、.Jaccard相似系数! m* I+ l: D# ~( M" G& R; y/ U4 K
D、皮尔森相关系数
正确答案:,B
: ]! L+ e- V9 L3 C

答案来源:谋学网(www.mouxue.com),随机游走的马尔可夫链中,互联网中的每一个网页就是马尔可夫链中的一个();该马尔可夫链平稳时每个状态停留的概率即反映了相应网页的()。
A、序列4 P# i0 M' N/ z  j: I
B、隐变量
C、状态/ H: I# P: H% Z3 Q8 `- \
D、重要程度9 @: H0 `8 U$ V7 H  m
正确答案:,D

# O! F2 q# e: A* |- `2 t% V0 b
第31题,L2正则相较于L1正则可获得更稀疏的模型8 X* Z" [5 Z4 v% d! e$ V
T、对3 R, Y0 V1 C$ g9 E' x- `& y1 q( J; }
F、错' V' ^2 N7 X* Q; M. a
正确答案:F
. U8 d+ F! F( z2 \0 e, C8 G
( v1 `7 c& }2 T1 B, ]8 i7 z8 ^
第32题,决策树模型的缺点是分类效率低。(); ~$ P' w( {7 i) ^  b( b: x
T、对! |; F1 p5 E( B
F、错
正确答案:F
$ v1 w6 Z# k! ]( L7 t

第33题,FP-growth算法可以避免冗余的IO读写
T、对' n& S2 U% Y7 \8 {6 b# J  [
F、错
更多答案下载:谋学网(www.mouxue.com)9 l- G# n' [/ a
3 C. X+ _2 Y8 ~5 y  [
( z% i1 J' G8 f7 d% N
第34题,大数据分析模型讨论的问题是从大数据中发现什么
T、对
F、错3 ?4 p$ G8 n) K4 F6 t6 C
更多答案下载:谋学网(www.mouxue.com

7 N0 {; a" w& N& S7 q- O- T
第35题,单词-文本矩阵是一个稀疏矩阵。()
T、对
F、错) X$ ?  y3 m! O9 q4 i/ h+ i+ C
更多答案下载:谋学网(www.mouxue.com

6 l7 z3 z+ m6 k
第36题,通过大数据的分析将会更精确地预测未来的天气,帮助农民做好自然灾害的预防工作,帮助政府实现农业的精细化管理和科学决策。
T、对
F、错: j# B) Y; O$ ]  M9 F$ g  R
更多答案下载:谋学网(www.mouxue.com


第37题,同义词可以表示同一个话题,而多义词可以表示不同的话题。()5 h2 }- R) @& X% b! E3 Q* j
T、对  Q+ ~4 |+ M9 @3 t. b) Q2 z
F、错
更多答案下载:谋学网(www.mouxue.com)/ B( }5 U2 i& I. q
& i8 Q! p9 \, A% l! C% v# ^; i& F
( a) C  E% F; q" ^
第38题,支持向量机是所有知名的数据挖掘算法中最健壮、最准确的方法之一。()
T、对
F、错
更多答案下载:谋学网(www.mouxue.com)" a- P% w0 z( Y7 i* D5 a
& b4 L- p  P: H; g
9 Z& a6 ]# s( y7 x4 @! `- N
第39题,大数据分为"结构化数据"与"非结构化数据"和"半结构化数据"。0 Z7 C* K8 k9 }4 L6 f/ E
T、对7 q, I$ S! o# N/ G" _& [) S3 J
F、错/ m4 ]7 U$ m" z5 Q$ H) A
更多答案下载:谋学网(www.mouxue.com
% w+ q2 Y0 w$ Y' t1 W

第40题,不满足给定评价度量的关联规则是无趣的。1 b' N/ l) K  {/ a
T、对6 u/ `- e3 |! Z9 m; x
F、错+ P; L# @, `# k8 V# T
正确答案:F
' R* V9 z1 ~) l$ Z
$ y0 k( l3 i* H5 N( b. N. _) F. Z
第41题,Apriori算法采用了逐层搜索的迭代方法。()$ O1 p* F9 i1 M4 P9 `4 ?+ G
T、对; w- I6 W! k. `0 X
F、错
更多答案下载:谋学网(www.mouxue.com
$ A6 Q0 g! ]) g: }5 o

第42题,效用矩阵的数据可以通过隐式方法获得,得到的数值中0相比较1表示受喜欢度较低2 {* D$ V8 y  H8 F6 n! N# J0 V
T、对
F、错
正确答案:F

" w( T5 }5 @$ E! \. U9 s, w& T
第43题,PageRank可以定义在任何有向图上,后来被应用到社会影响力分析、文本摘要等多个问题。
T、对1 v# N. P6 |9 Z  |/ A
F、错
更多答案下载:谋学网(www.mouxue.com
2 B" U/ {( D9 g' [) ]' I- Z

第44题,HITS的性能跟PageRank相差较多。()
T、对  ^  s: f5 m- i% o
F、错5 ?- n+ s$ }8 M; W( `7 K1 b  h# o
正确答案:F* `4 }- a! ~; J# t
8 ]3 q* s4 J2 |8 `) P% P  \; l: t
; f+ s6 m' e1 n/ b
第45题,切比雪夫距离计算是取哥哥坐标数值的绝对值的最大值。()
T、对/ q4 }) U/ W* J# r& R( G/ s
F、错
正确答案:F6 \* f' N* p' T
& o+ Q0 A5 s* c6 z; J+ l% L- Y, N  W

第46题,推荐系统经常被应用于在线商城、个性化阅读以及电影推荐
T、对
F、错: ]: W* s/ ]3 x
更多答案下载:谋学网(www.mouxue.com)0 }3 D! y. [4 ~# {9 I7 y9 r& U
6 |* E, n# ]; [% X5 p3 Y" V: E7 L3 O2 Q
/ {1 I( e) W- |* t5 B- T) o
第47题,决策树学习的分类规则不能根据学习归纳得出。()4 F; c: ?9 u% v) M; x
T、对
F、错+ y7 Q' p8 J" s& M# r& I* m
正确答案:F
  O5 [+ l: P0 Y+ h( Z$ h7 }
1 {& i, q% A1 e8 j; j9 [' k
第48题,大数据规则性分析用于预测未来时间发生的概率和演化趋势
T、对8 [. p6 g+ C/ l6 i/ a$ ~
F、错
正确答案:F


第49题,大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。
T、对) a; W) C7 I) f2 _2 }! x
F、错


推荐与用户喜欢的演员、导演相同或流派相似的电影,是一种基于内容的推荐算法; Z2 J, f4 h$ v
T、对1 ?7 D0 P' b0 P) z
F、错!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  • 价格公开

  • 优质服务

  • 专属客服

  • 信息开放

  • 担保交易

 
 
客服一号
客服二号
客服三号
客服四号
点击这里给我发消息
官方微信扫一扫
快速回复 返回顶部 返回列表