• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 问答库 问答库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

CDA LEVELⅠ2021新版模拟题二附答案

武飞扬头像
狐狸的帽子
帮助1

总结整理不易,记得一键三连(关注哦,其他练习题库正在整理中,在评论框发“模拟题”三个字给你们发word版方便自测)
考试题型:客观选择题(单选 80 题 多选 20 题 内容相关 20 题 案例分析 20 题)

第二套

单选1:

1.数据分析方法论为分析项目提供了基础框架,以下不属于数据分析方法论的选项是
• A.CRISP-DM
• B.SEMMA
• C.AB测试
• D.UML
D前三个选项是常用的分析方法论,D选项UML是统一建模语言的缩写,不属于数据分析范畴

2.数据分析师是一个科学严谨的岗位,对于从业人员专业性的要求非常高,以下行为中不能体现数据分析师专业性的是
• A.在分析成果完整交付后不断改进算法
• B.充分了解业务需求后展开分析任务
• C.不断迭代数据模型优化分析结果
• D.只提供对业务结论有利的数据信息
D 数据分析师应提供全面、准确的数据信息而不是只提供对业务结论有理的数据信息

3.数据分析师应严格遵守职业操守,以下关于数据分析师应遵守的职业道德操守描述错误的是
• A.坚持诚信、公平、尊重、敬业的原则
• B.遵法守纪、严于律己
• C.保护数据资产的安全性
• D.不使用不完善的算法模型
D D选项,算法模型应在应用过程中不断改善,不存在100%完善模型

4.表格结构数据是业务工作中最为常见的数据类型,表格结构数据的基本引用单位是
• A.字段
• B.表
• C.单元格
• D.列表
表格结构数据引用的基本单位是单元格,答案是C

5.表格结构数据是应用与电子表格工具上的数据,以下不属于表格结构数据函数类型的是
• A.查找类函数
• B.数学类函数
• C.文本类函数
• D.筛选器类函数
D D选项的筛选器类函数是Power BI工具中DAX表达式使用的函数类型,是针对表结构数据进行计算的类别,所以是错误的

6.在电子表格工具中引用Sheet2工作表中单元格方法正确的是
• A.Sheet2!B2
• B.Sheet2?B2
• C.Sheet2&B2
• D.“Sheet2:B2”
A 工作表名 ! 单元格地址是正确单元格引用方法,所以A是正确的

7.表格结构数据先引用再计算,以下针对表格结构数据引用计算方式描述错误的是
• A.可以引用其他工作表中的单元格值进行计算
• B.单元格是基本引用、计算单位
• C.可以进行单元格区域与单元格区域间的计算
• D.不能引用其他工作簿中的单元格进行计算
可以引用其他工作不中的单元格,D描述是错误的

8.理解表结构数据特征是使用表结构数据的前提,以下关于表结构数据特征描述正确的是
• A.一个表只能有一种数据类型
• B.字段中不能有null值
• C.一行记录只能有一种数据类型
• D.主键可以由多个字段构成
一个字段只能有一种数据类型,字段中可以出现null值,一行记录可以有不同数据类型,前三项都是错误的,所以描述正确的是D

9.理解主键的业务意义是使用表结构数据进行分析的前提,主键的业务意义指的是
• A.表的业务记录单位
• B.表的行识别符
• C.表中非主键字段的计算对象
• D.表的业务逻辑
A B是主键的物理意义,C与D是错误描述,所以A是主键业务意义,是正确答案

10.关于表结构数据使用及分析特征,描述错误的是
• A.可以引用多数据源数据
• B.可以进行单元格计算
• C.可以搭建多维数据环境
• D.可以合并不同表中不同字段信息
单元格计算是表格结构数据特征,所以描述错误的选项是B

11.关于使用表结构数据时的注意点以下描述错误的是
• A.null值影响计算精度
• B.一个表中字段名不能重名
• C.不同字段记录行数可以不同
• D.不同表中记录可以合并在一起
表中所有字段记录行数相同,C是错误描述

12.表结构数据分析过程中,ETL发挥着重要作用,以下关于ETL功能描述错误的是
• A.抽取
• B.转换
• C.加载
• D.分析
ETL包含抽取、转换以及加载功能,不包含分析功能,所以答案是D

13.横向合并两表时不太可能遇到的连接关系是
• A.一对一
• B.一对多
• C.多对多
• D.多对一
一对一指的是两表具有相同主键,在数据库中基本不会出现这种情况,所以答案是A

14.多维数据模型是数据仓库中数据组织的一种模型,多维数据模型工具功能定位是()?
• A.OLAP
• B.OLTP
• C.DW
• D.ETL
OLAP是联机分析处理,是搭建多维数据模型的处理过程,所以答案是A

15.透视分析就是维度对度量的汇总观测,关于汇总描述错误的是
• A.度量用来描述业务结果程度
• B.维度用来描述业务不同侧面
• C.汇总结果由维度、度量、汇总规则决定
• D.出度量的表称为维度表
汇总分析中事实表出度量值,所以D是错误描述

16.想要将不同数据表中的数据进行关联时,我们可以采用表的横向连接。以下不是SQL表横向连接方式的是( )
• A.right join
• B.left join
• C.union
• D.inner_join
C是纵向连接,不是横向连接命令,所以选C

17.删除数据表中的数据有多种方法,在以下SQL语句中删除表中所有数据但保留表结构的命令是
• A.DELETE
• B.DROP
• C.CLEAR
• D.REMORE
Delete是删除记录但不删除数据库对象,所以选A

18.完整性约束是为了防止不符合规范的数据进入数据库,在用户对数据进行插入、修改、删除等操作时,DBMS自动按照一定的约束条件对数据进行监测,使不符合规范的数据不能进入数据库,以确保数据库中存储的数据正确、有效、相容。请问关系型数据库的完整性约束条件有( )。
• A.主键约束
• B.非空约束
• C.唯一约束
• D.以上都是
D 完整性约束条件可以对字段进行限制,规定字段内容。

  1.  

SQL 语言可细分为数据定义语言、数据操作语言、数据控制语言、数据查询语言,下面哪项不属于数据操作语言()
• A.INSERT
• B.UPDATE
• C.ALTER
• D.DELETE
C alter是修改对象属性的命令属于数据定义语言,所以C是错误描述

20.数据库中的数据不要随意修改,如必须修改更新表中数据的命令是()
• A.CLEAR
• B.UPDATE
• C.DELETE
• D.ADD
update是更新数据命令,clear用于清除sql语句和结果窗格,delete用于删除记录,add为添加字段命令,所以选B

单选2:

1.在SQL语句中我们判断数据是否在某个范围内可以使用BETWEEN关键字,现有语句 X BETWEEN 10 AND 20 ,下列与其等价的表达式是()
• A.X>10 AND X<20
• B.X>10 AND X<=20
• C.X>=10 AND X<20
• D.X>=10 AND X<=20
D ⽐较运算符BETWEEN … AND …表示在某个范围值之间,包括范围值在内。

2.SQL语言中每个函数出现的位置都是有要求的,稍有错误就会导致语法错误或者结果数据的计算错误。SQL中的COUNT、SUM、AVG、MAX、MIN等函数,不可以出现在()子句中
• A.SELECT
• B.WHERE
• C.HAVING
• D.ORDER BY
B 由于SQL语句的执行顺序:FROM -> ON -> JOIN -> WHERE -> GROUP BY -> HAVING -> SELECT -> DISTINCT -> UNION -> ORDER BY -> LIMIT,WHERE子句中不能用聚合函数。

3.SQL使用on关键字实现两表字段间的关联,在连接查询时建⽴连接的关键字段可以有⼏个()
• A.一个
• B.两个
• C.多个
• D.一个或多个
D 连接查询时的连接条件可以是⼀个或多个。

4.使用“select * from 表 1 inner join 表 2 on 表 1.员工 id = 表 2.员工id”语句对下边两个表进行查询,查询结果中应有几行数据
学新通

• A.2
• B.3
• C.4
• D.5
C 在连接两表的字段中有重复值且两个 字段的值不是一对一匹配关系时,内连接的结果是把两表中都有的值列出来, 并且有重复值的地方进行多对多匹配。

5.子查询也称为内部查询或内部选择,关于子查询的语法规则,正确的是( )
• A.子查询必须放在圆括号里
• B.由外到内执行,先执行外部的主查询,再执行内部的子查询
• C.可以嵌套无数个子查询
• D.所有的子查询都必须添加别名
A 暂无答案解析

6.在SQL语句中每种语法都有其位置规范,放错位置是会导致错误的,SQL中子查询可以出现在以下哪个子句中()
• A.GROUP BY
• B.ORDER BY
• C.HAVING
• D.LIMIT
C 子查询可以出现在SELECT、WHERE、HAVING、FROM、JOIN子句中。

7.在用SQL写计算指标的代码时会经常用到聚合函数,以下聚合函数中,使⽤正确的是()
• A.COUNT()
• B.MIN(
)
• C.MAX()
• D.SUM(
)
A COUNT()函数对给定数据进⾏计数,COUNT(*)表示对表中所有记录进⾏计数;⽽其他聚合函数只能对给定字段的值进⾏计算。

8.日期函数是SQL中的重要函数,以下哪个函数用来返回当前的日期及时间()
• A.NOW
• B.TIME
• C.DATE
• D.TIMENOW
A NOW函数用来返回当前的日期及时间信息。

9.国家经常会对国民收入进行分析研究,若要对比各个国家之间的人均收入与人均支出的离散程度,应使用以下哪种统计量( )。
• A.方差
• B.离差
• C.离散系数
• D.相关系数
C 离散系数又称变异系数,是统计学当中的常用统计指标,主要用于比较不同水平的变量数列的离散程度及平均数的代表性。

10.一组数据为1、3、5、7、9,它们的样本方差为( )
• A.8
• B.10
• C.12
• D.14
B 样本方差计算公式为: 学新通
11.教育水平作为定序型变量,若要描述其离散程度,可选用以下哪种方法( )
• A.平均差
• B.四分位差
• C.方差
• D.标准差
B 另外三种都只能用于描述数值型数据。

12.在研究数据中,有一个变量“饮料类型”有4 个水平“果汁”、“碳酸饮料”、 “能量饮料”和“其他”,由于该变量的少量数据缺失,那么缺失值用哪种填充 方式会比较好?
• A.均值
• B.中位数
• C.众数
• D.调和平均数
C 这是分类数据,只能用“众数”。

13.某手机电池生产商对电池的生产工艺进行了改进,并对外宣称改进后的电池能够显著的提高手机待机时间,为了检验该改进工艺是否有效,我们将进行t检验。通常在t 检验之前我们首选需要进行( )
• A.工艺改进前后的数据相关性分析。
• B.使用线性回归,检验工艺改进对待机时间的影响。
• C.进行F 检验,判断两个总体的方差是否存在显著差异。
• D.使用卡方的独立性检验查看工艺改进与待机时间是否相关。
C t 检验之前先要F 检验,判断方差是否有显著差异。

14.如果一组数据的分布是对称的,则偏态系数等于0; 如果偏态系数明显不等于0,表明分布是非对称的。有一组数据的偏态系数为-4.23,那么下面表述正确的是( )
• A.这是一组极度左偏的数据
• B.偏态系数在0 附近,所以只是轻微的左偏
• C.偏态系数在0 附近,所以只是轻微的右偏
• D.这是一组极度右偏的数据
A 偏态系数为正,则为右偏分布;偏态系数为负,则为左偏分布。 偏态系数越接近0,偏斜程度就越小。若偏态系数大于1或小于—1,称为高度偏态分布;若偏态系数在0.51或—1—0.5之间,则认为是中等偏态分布。

15.盒须图(箱线图)是利用数据中的5个统计量来描述数据的一种方法,适用于对几个样本数据的比较。在箱线图中Q1到其最近的内限距离为( )。
• A.IQR
• B.1.5IQR
• C.0.5
• D.0.75
如图在Q3 1.5IQR和 Q1-1.5IQR处的两条线端即为内限,距离Q1近的内限为下限,距离远的为上限。距离如下图所示:学新通
16.现有两个变量X与Y,下图横轴为X变量,纵轴为Y变量,则关于下图描述错误的是( )
学新通• A.X 和Y 之间存在明显的非线性关系
• B.这些散点中没有明显的异常点
• C.X 和Y 之间是正相关的
• D.无论对X 和Y 如何处理,都不适合用线性回归来分析两者之间关系
D 可以先做非线性处理,再用线性回归。

17.在电商业务中的客户表与订单表的对应关系是
• A.一对多
• B.一对一
• C.多对多
• D.多对一
A 客户表是维度表是一表,订单表是事实表是多表,所以选A

18.某零售企业数据库中产品表与品牌表的对应关系是
• A.多对一
• B.一对一
• C.多对多
• D.一对多
A 一个品牌下有多种产品,所以选A

19.在某零售企业销售业务的多维模型中可能成为事实表的是
• A.客户信息表
• B.产品信息表
• C.销售表
• D.品牌信息表
C 事实表记录业务行为过程,所以选C,其余选项是维度表

20.在某电商企业数据库中使用订单表、产品表与品牌表构成多维模型,三者可能构成的连接模式是
• A.雪花模型
• B.交叉模型
• C.星型模型
• D.星座模型
A 订单表是事实表展开产品与品牌两层维度表,展开多层维度是雪花模式,所以正确答案是A

单选3:

1.为某经销商企业销售人员绩效应使用的对比方式是
• A.均比
• B.基准比
• C.标准比
• D.目标比
D 前三个选项不适用于销售绩效,所以应选D,销售绩效可以用同环比或目标比等

2.为某IT综合服务商销售人员绩效应使用的对比方式是
• A.基准比
• B.标准比
• C.均比
• D.同环比
D 前三个选项不适用于销售绩效,所以应选D,销售绩效可以用同环比或目标比等

3.在描述电商平台客户交易详情中,针对单号 产品号为主键的交易详情表求交易次数应使用
• A.COUNT(单号)
• B.COUNT(产品号)
• C.DISTINCTCOUNT(单号)
• D.DISTINCTCOUNT(产品号)
C 主键中包含单号及产品号,单号为交易记录单位,有重复值,所以对单号去重才能得到不同单号也就是不同交易的数量,所以选C

4.为某电商销售情况分析,使用订单表、产品表与客户表搭建了多维数据模型,在这三表间进行多维透视分析时,以下选项中描述正确的是
• A.三表生成星型模式连接
• B.三表生成星座模式连接
• C.三表生成雪花模式连接
• D.三表生成交叉模式连接
A 一个事实表连接两个维度表是星型模式,所以选A

5.业务理解是分析流程的第一步,关于业务理解描述错误的是
• A.理解业务流程
• B.理解业务指标
• C.理解业务需求
• D.理解数据详情
D不是业务理解阶段的工作,所以选D

6.“数据敏感性”是数据分析人员的重要软性技能之一,以下不属于“数据敏感性”涉及范围的是
• A.理解分析结果
• B.理解问题原因
• C.理解问题影响
• D.理解数据结构
D D是数据分析技能不是不属于数据敏感性范畴

7.理解字段的特点是使用表结构数据进行分析的前提,以下选项中能够进行去重计数规则计算的字段是
• A.销量
• B.利润额
• C.城市
• D.重量
去重计数针对文本型字段,所以选C

8.假设某羽绒服品牌以往销量呈现季节性波动,请问衡量该羽绒服品牌当月销量好坏程度用哪个指标比较恰当?
• A.环比增长率
• B.同比增长率
• C.均比差异百分比
• D.标准比差异百分比
B 由于该羽绒服品牌销量具有季节性变化趋势,为减少影响因素用同比变化率较为恰当

9.理解聚合函数的特点才能正确进行透视分析,以下选项中应用count进行计数应尽量选取___字段
• A.维度字段
• B.主键字段
• C.公共字段
• D.任何字段
B count是非空计数,应尽量针对非空字段计数,所以选B

10.总销售额是业务描述性分析中常用的销售类指标,为了了解销售额的变化趋势,通过折线图查看过去一年每月的销售额走势,请问这属于指标分析方法的哪一类?
• A.纵向分析
• B.预警分析
• C.横向分析
• D.以上都不是
A 在指标分析中纵向分析指的是时间周期下指标的变化规律

11.在电商营销运营分析中与分析流量行为特征无关的是
• A.平均访问深度
• B.访问次数
• C.新访客占比
• D.跳失率
C C是流量自身属性,不是流量行为特征

12.小平台为获取用户往往需在用户量大且活跃的大平台投放广告,广告投放的计费模式有多种,请问CPS广告计费模式按照_作为计费参照标准
• A.触达人群数量
• B.付费金额占比
• C.行为
• D.以上都不对
B CPS (Cost Per Sales) 按实际付费金额占比收费。

13.小平台为获取用户往往需在用户量大且活跃的大平台投放广告,广告投放的计费模式有多种,请问CPM广告计费模式按照__作为计费参照标准
• A.触达人群数量
• B.付费金额
• C.每千次曝光
• D.行为
C CPM (Cost Per Mille) 按每千次曝光收费

14.指标分析是业务描述性分析中观测业务行为结果的重要方法,以下关于指标的概念描述错误的是
• A.指标间可组合成为新指标
• B.指标需与维度结合使用
• C.指标与时间单位无关
• D.指标可以描述业务行为的好坏程度
所有指标都要有时间单位才能描述好坏程度,所以选C

  1.  

某综合性超市,商品种类高达30000多个,在鸡蛋这个品类层级下,一斤商品价格区间在4元-100元内波动,先需分析该品类下最畅销的商品,请选择合适的指标?
• A.销售额
• B.销量
• C.库销比
• D.动销率
B 题干中指出商品价格波动大,故销售额受到单价影响,库销比主要用于查看库存与销售之间的关系用于库存管理场景分析,动销率主要用于分析是否存在销售行为,而非销售的多与少,故选择销量指标可有效规避价格影响。

  1.  

帮助某经销商描述其资金利用效果高低的指标是
• A.库销比
• B.动销率
• C.售罄率
• D.残损率
库销比代表进销存流转速度,流转速度越快资金利用效率越高,所以选A

  1.  

RFM模型是针对用户使用的重要分类模型,RFM模型中的M指的是
• A.最近一次消费
• B.单位时间内的消费次数
• C.消费金额
• D.客单价
C是正确描述

  1.  

漏斗模型可以描述完整事项中各递进阶段的状态特征,以下选项中适用漏斗模型的场景是
• A.客户特征分析
• B.流量付费分析
• C.产品特征分析
• D.活动效果分析
B流量付费可分为多个递进阶段对其各阶段情况进行描述可以使用漏斗模型

  1.  

理解及活用业务分析模型在业务描述性分析中非常重要,以下哪种模型可用来梳理数据线索
• A.5W2H
• B.SWOT
• C.RFM
• D.波士顿矩阵
A是正确描述、用5W2H模型帮助我们梳理数据线索

20.树状体系图是展现业务指标间关系构成的常见图表,以下选项中使用树状体系图的目的不包括
• A.原因追踪
• B.鸟瞰全局
• C.预估影响
• D.进度管理
树状体系图不能描述进度情况,所以选D

单选4:

1.某电商平台使用SKU与SPU来衡量不同产品,以下描述中属于SPU的是
• A.可口可乐 整箱装
• B.饮料
• C.可口可乐零度500ml*24
• D.可口可乐
A A是正确描述,SPU是商品的品类细分,比大品类细,比具体商品粗

2.为某教育培训企业评估销售行为推进力度好坏程度可以使用
• A.销售阶段周转化率
• B.销售目标达成率
• C.库存周转率
• D.成交金额环比增长率
A,销售阶段转化情况适用于漏斗模型分析,用来描述推进力度

3.波士顿矩阵是企业在规划产品组合时常用的分析工具,波士顿矩阵中的瘦狗产品在下图中所处象限是()
学新通

• A.①
• B.②
• C.③
• D.④
D 通过相对市场占有率、销售增长率两个因素相互作用,会出现四种不同性质的产品类型,形成不同的产品发展前景: ①销售增长率和市场占有率“双高”的产品群(明星类产品); ②销售增长率和市场占有率“双低”的产品群(瘦狗类产品); ③销售增长率高、市场占有率低的产品群(问题类产品); ④销售增长率低、市场占有率高的产品群(金牛类产品)。
4.波士顿矩阵是成熟的业务模型矩阵,波士顿矩阵定义了四类不同特征产品,其中在波士顿矩阵中明星类产品的特点是
• A.销售增长率高,市场占有率低
• B.销售增长率高,市场占有率高
• C.销售增长率低,市场占有率高
• D.销售增长率低,市场占有率低
B是正确描述

5.进行业务分析时应同时关注企业的财务指标情况,其中企业利润计算公式正确的是
• A.收入-成本
• B.收入 资产-成本
• C.资产-成本
• D.资产-收入-成本
A是正确描述

6.漏斗模型用来掌握业务流程中个递进阶段情况,以下选项中漏斗模型不适用的选项是
• A.状态递进力度
• B.业务流程中的风险情况
• C.各阶段业务行为效果情况
• D.业务行为获利情况
获利情况不是阶段递进过程,不适用于漏斗分析模型,所以选D

7.树状体系图用来描述指标间的逻辑构成关系,以下选项中不属于树状体系图中拆解上层指标依据的是
• A.父子级构成关系
• B.逻辑计算关系
• C.数据连接关系
• D.业务联系关系
C,数据连接关系是数据表合并时使用的逻辑,与树状体系图无关

8.在业务描述性分析中针对不同分析对象可以使用不同业务模型进行分析,以下选项中不适合做客户行为分析的模型是
• A.5W2H
• B.漏斗模型
• C.RFM
• D.波士顿矩阵
D,波士顿矩阵适用于对商品的描述而不是客户

9.业务描述性分析中可视化图表可分为业务类图表及统计类图表两大类,关于统计类图表坐标轴特征描述正确的是
• A.可以使用客户类别作为坐标轴
• B.可以使用价格档位作为坐标轴
• C.可以使用年份作为坐标轴
• D.可以使用产品ID作为坐标轴
B是正确描述,统计类图表不能使用业务维度坐标轴

10.在业务描述性分析中使用的可视化图表中可以快速确认数据的分布以及数据分中位数、四分位数的图表的是
• A.气泡图
• B.散点图
• C.箱型图
• D.折线图
C,箱型图是正确图表

11.某电脑厂商有A、B、C三类品牌产品,描述A\B\C三类品牌产品的不同性能差异应使用
• A.散点图
• B.气泡图
• C.雷达图
• D.条形图
C,雷达图突出对象间差异程度

12.以下选项中能够划归于图形决策树中属序列类图表的是
• A.漏斗图
• B.桑吉图
• C.箱型图
• D.饼图
A,漏斗图描述状态阶段的顺序递进关系,属于序列类图表

13.数据分析人员使用业务分析报告汇报分析成果,以下不属于业务分析报告调整完善阶段的是
• A.确定主题
• B.发现问题
• C.KPI指标分类分析
• D.规划结构、提纲、主要内容
A,主题应在设计阶段确定

14.某家电企业想要对第三季度的电视机、电饭锅、电风扇三类产品的销售额进行比较,可以使用下列哪个图表?()
• A.柱形图
• B.折线图
• C.达成率图
• D.树状图
A,不同对象间的比较应使用柱形图

15.数据分析人员使用业务分析报告汇报分析成果,业务分析报告中的文字描述不应
• A.对已有数据信息的重复描述
• B.进行有合理依据的适当推测
• C.根据数据表现,给出建议
• D.对数据结论进行归纳总结性描述
A,文字不应重复描述图表课直接的传递内容

16.分析人员为决策者提供业务分析报告作为决策依据使用,不同场景下分析报告的软件载体也要有所区别,在会议上使用的业务分析报告载体是
• A.Word
• B.Excel
• C.Power BI
• D.PPT
D,会议上应使用PPT作为分析载体

17.BI报表与业务分析报告是业务描述性分析中两类不同的分析结果的呈现形式,以下关于BI报表与业务分析报告的差异描述错误的是
• A.使用的数据源不同
• B.描述侧重点不同
• C.呈现方式不同
• D.BI报表的业务应用价值大于业务分析报告
D,两者根据不同目的进行区分使用,没有价值高低之分

18.BI报表需要结合业务需求进行设计、分析、制作完成,在BI报表的设计阶段主要是将抽象的业务逻辑转化为具象的___的过程
• A.数据
• B.可视化图表
• C.维度和度量
• D.切片器
C,BI报表设计的核心内容是明确业务需求涉及到的维度与度量

19.BI报表与业务分析报告是业务描述性分析中两类不同的分析结果的呈现形式,BI报表区别于分析报告的特征中描述正确的是
• A.单源数据
• B.集中描述业务点问题
• C.交叉维度下观测详情
• D.以PPT形式报告结果
C是正确描述,BI分析的主要特点是多维度下的透视分析

20.一个BI项目由多个不同步骤构成,不同步骤又对应不同功能的工具,以下不属于BI工具组成部分的是
• A.ETL
• B.可视化工具
• C.DW
• D.DB
D,DB是BI项目之外的数据源

内容相关:

1.以上订单表与订单详情表间用于连接的公共字段应是____
学新通
上图多表连接关系中,可以作为事实表使用的表的个数是____个
• A.3
• B.4
• C.6
• D.7
进、销、存三个业务模式对应销售表、采购进货单明细与库存表三个事实表,所以正确答案是A

2.销售表、库存表、采购进货单明细表、产品表构成的连接模式是
• A.星型模式
• B.星座模式
• C.雪花模式
• D.交叉模式
多个事实表共用某些维度表的连接模式成为星座模式,所以正确答案是B
3.现有订单表orders,包含字段:订单号order_id varchar(10),产品编号p_id varchar(10),产品类型type varchar(20),金额amount decimal(10,2)。 以下表名orders和字段名amount的使用,正确的是
• A.orders.amount
• B.orders_amount
• C.orders$amount
• D.orders[amount]

A 数据库中的限定符为“.”。
4.现有订单表orders,包含字段:订单号order_id varchar(10),产品编号p_id varchar(10),产品类型type varchar(20),金额amount decimal(10,2)。 与表达式"产品类型 NOT IN (‘a’,’b’)"功能相同的表达式是
• A.产品类型=’a’ AND 产品类型=’b’
• B.产品类型!=’a’ OR 产品类型=’b’
• C.产品类型=’a’ OR 产品类型!=’b’
• D.产品类型!=’a’ AND 产品类型!=’b’
D NOT IN表示不在其中,即不等于其中任何一个。

5.数据库中有两张表,users表中有三个字段(user_id,user_name,create_at),orders表中有三个字段(order_id,user_id,amount) 查询users表中存在而orders表中不存在的user_id
• A.select users.user_id from users left join orders on users.user_id=orders.user_id;
• B.select users.user_id from users right join orders on users.user_id=orders.user_id;
• C.select users.user_id from users left join orders on users.user_id=orders.user_id where orders.user_id is null;
• D.select users.user_id from users right join orders on users.user_id=orders.user_id where users.user_id is null;
C A以users为主表左连接,返回users表中所有的user_id。B以orders为主表右连接,返回orders表中所有的user_id。D以orders为主表右连接并筛选users表中user_id为空的记录,返回的是orders表中存在而users表中不存在的user_id。而C以users为主表左连接并筛选orders表中user_id为空的记录,返回即是users表中存在而orders表中不存在的user_id。

6.数据库中有两张表,users表中有三个字段(user_id,user_name,create_at),orders表中有三个字段(order_id,user_id,amount) 运行以下SQL查询语句,哪句不会报错
• A.select user_id,avg(amount) from orders where avg(amount)>2000;
• B.select user_id,avg(amount) from orders group by user_id where avg(amount)>2000;
• C.select user_id,avg(amount) from orders where avg(amount)>2000 group by user_id;
• D.select user_id,avg(amount) from orders group by user_id having avg(amount)>2000;
D 查询语句的书写顺序中,where子句应该在group by子句之前,且where子句中不能用聚合函数。

7.已知样本数据7、8、9、12、15,计算得到的偏度大于0,峰度小于0。 根据样本偏度,可以得到该数据分布是怎样的?
• A.负偏
• B.左偏
• C.右偏
• D.不确定
C 偏度大于0为右偏分布,小于0为左偏,等于0为无偏
8.已知样本数据7、8、9、12、15,计算得到的偏度大于0,峰度小于0。 该样本的峰度分布密度曲线与正态分布相比,呈现怎样的形态?
• A.平顶型
• B.尖顶型
• C.与正态分布一致
• D.不确定
A 峰度小于0说明数据分布更扁平,大于0说明数据分布更尖,等于0则与正态分布一致

9.下表为某电商用来记录购买信息时使用的订单表,请参照下表内容回答问题:
学新通
应用上表所示信息,选择计算所有客户购买金额的总平均金额时应使用的正确汇总函数是
• A.average(客户名称)
• B.average(产品金额)
• C.sum(产品金额)/count(客户名称)
• D.sum(产品金额)/distinctcount(客户名称)
订单表中一个客户对应多笔订单,所以不能直接用average对单号为主键的订单表求总平均值,应使用总合计/总客户个数的方法计算客户总平均值,统计客户数量时应使用去重计算方式求不重复顾客数,所以正确答案是D

10.下表为某电商用来记录购买信息时使用的订单表,请参照下表内容回答问题: 学新通根据上表数据计算所有订单的总平均金额是
• A.400
• B.500
• C.600
• D.800
C 订单的总平均=订单总金额/非重复订单数,所以结果是600

11.HR找来CDA培训企业员工的数据分析能力,报名的同事有200人,HR特意租了公司附近的酒店作为培训室,可实际只有10人参与培训,20人请假 假设出勤率=实际出勤人数/报名总人数,请问培训的出勤率是多少?
• A.0.01
• B.0.02
• C.0.04
• D.0.05
按照计算公式 计算结果为D

12.HR找来CDA培训企业员工的数据分析能力,报名的同事有200人,HR特意租了公司附近的酒店作为培训室,可实际只有10人参与培训,20人请假 有什么办法可以提升出勤率?
• A.出勤率与绩效挂钩
• B.培训前签到
• C.培训开始前10分钟再次通知
• D.培训场地转移到公司内
从题目中知道出勤率过低,说明重视程度不够,最有效的方法是改变绩效方式,所以选A

13.某电商在营销运营业务中使用AARRR业务模型设计业务流程行为,请回答以下关于AARRR模型的问题:在各选项中,适用该电商AARRR模型使用的指标是
• A.ARPU
• B.CRM
• C.MTD
• D.CVM
A ARPU是每用户平均收入,是评估AARRR模型效果的重要参考指标之一,所以选A,其余选项都与AARRR模型无关

14.某电商在营销运营业务中使用AARRR业务模型设计业务流程行为,请回答以下关于AARRR模型的问题:在该电商AARRR模型中,可在哪个阶段对K因子进行分析
• A.第一个A阶段
• B.第二个R阶段
• C.第三个R阶段
• D.第二个A阶段
C K因子是推荐系数,应使用在第三个R,推荐阶段

15.下表是某电商平台各来源每天记录的各指标数据,根据下表回答以下问题:学新通
上表每行记录的业务意义是
• A.访问来源的指标情况
• B.访问渠道的指标情况
• C.访问来源不同日期的指标情况
• D.访问渠道不同日期的指标情况
C 表中数据的主键是访问日期 访问来源,主键是业务数据的记录单位,所以正确答案是C

16.下表是某电商平台各来源每天记录的各指标数据,根据下表回答以下问题: 学新通
以上数据反映各来源渠道流量的行为状态,该数据适用的分析模型是
• A.漏斗模型
• B.AARRR模型
• C.帕累托模型
• D.RFM模型
漏斗模型适用于对动态递进的行为状态变化进行监控及分析,所以选A
17.下图是根据RFM模型对某公司客户进行的分层,以及不同客户的帕累托图,根据下图回答以下问题:学新通
学新通
结合上图内容思考该公司一般保持用户的特点是
• A.即将流失
• B.贡献价值高
• C.已经流失
• D.以上都不对
R与M值都低,说明用户贡献价值低,对店粘性差,即将流失的风险高,所以选A

18.本题图同17,是根据RFM模型对某公司客户进行的分层,以及不同客户的帕累托图,根据下图回答以下问题: 在有限资金下为提高收入,应重点对哪类人群进行营销
• A.一般挽留用户
• B.一般发展用户
• C.重要价值用户
• D.一般价值用户
结合帕累托图及用户类别特征可判断出一般发展用户贡献度高,到店积极,刺激提高贡献价值后的预期收益高,所以选B

案例分析

1.学生信息表student,包含id(学生编号),stuname(学生姓名)。 以下哪个语句可以在student表中查找出id=0以及id=1的信息
• A.SELECT * FROM student WHERE id = 0 OR id = 1;
• B.SELECT * FROM student WHERE id = 0 AND id = 1;
• C.SELECT * FROM student WHERE AND(id = 0,id = 1);
• D.SELECT * FROM student WHERE OR(id = 0,id = 1);
A 选项C与D的语法错误,选项B使用AND关键字用来求id即等于0又等于1的交集信息,条件不成立,只有OR关键字是求id=0或id=1的并集信息。所以答案为A。

2.学生信息表student,包含id(学生编号),stuname(学生姓名)。 以下哪个语句可以用来删除student表中的id字段
• A.UPDATE TABLE student DELETE id;
• B.DROP id FROM student;
• C.DELETE id FROM student;
• D.ALTER TABLE student DROP id;
对表进行增加、修改以及删除字段操作时应使用ALTER TABLE语句,只有D满足条件。

3.学生信息表student,包含id(学生编号),stuname(学生姓名)。 以下哪个语句可以将student表中的stuname字段的位置移致id字段之后
• A.ALTER TABLE student MODIFY stuname AFTER id;
• B.ALTER TABLE student MODIFY stuname VARCHAR(8) AFTER id;
• C.ALTER TABLE student MODIFY id BEFORE id;
• D.ALTER TABLE student MODIFY id VARCHAR(8) BEFORE id;
在SQL中调整字段位置时使用的关键词为FIRST和AFTER没有BEFORE,所以排除了C和D选项,在使用ALTER TABLE…MODIFY…语句更改字段属性或位置时至少需要指定字段名 字段的数据类型,所以排除A选项,所以答案为B。

4.学生信息表student,包含id(学生编号),stuname(学生姓名)。
以下哪个语句可以输出以下内容
学新通

• A.SELECT stuname, GROUP_CONCAT(id) FROM student;
• B.SELECT stuname, GROUP_CONCAT(id) FROM student GROUP BY stuname;
• C.SELECT stuname, id FROM student GROUP BY stuname;
• D.SELECT stuname, id FROM student;
B GROUP_CONCAT()函数常与关键字GROUP BY一起使用,能够将分组后指定的字段值都显示出来。

5.下面5组数据的观察值(x,y)的组合分别为: (6,6)、(11,9)、(15,12)、(21,17)、(27,16)。 尝试绘制散点图观察x与y之间存在何种可能的关系?
• A.线性相关关系
• B.不相关
• C.非线性相关关系
• D.无法确定
A 观察图像即可发现 两者存在线性相关关系
学新通

6.下面5组数据的观察值(x,y)的组合分别为: (6,6)、(11,9)、(15,12)、(21,17)、(27,16)。 计算x与y之间的相关系数
• A.0.69
• B.0.94
• C.0.71
• D.0.82
B 相关系数的计算公式为(x与y的协方差)除以(x和y标准差的乘积),直接计算可得

7.下面5组数据的观察值(x,y)的组合分别为: (6,6)、(11,9)、(15,12)、(21,17)、(27,16)。 变量x值按一定数量增加时,变量y也按一定数量随之增加,反之亦然,那么x与y之间存在何种关系?
• A.负相关关系
• B.正相关关系
• C.曲线相关关系
• D.不确定
B 这是典型的正相关关系,反映到计算上就是一个线性函数,反映到图像上就是一条直线

8.下面5组数据的观察值(x,y)的组合分别为: (6,6)、(11,9)、(15,12)、(21,17)、(27,16)。 在该样本数据中,对相关系数计算结果描述正确的是?
• A.说明x与y之间存在低度正相关的线性关系
• B.说明x与y之间存在中度正相关的线性关系
• C.说明x与y之间存在高度正相关的线性关系
• D.说明x与y之间存在高度负相关的线性关系
C 相关系数大于0说明正相关,相关系数非常接近于1说明正相关性很强

9.下图是某公司交易相关的各表连接关系,观察下图回答以下问题:学新通
学新通
订单表与订单提成表都是用来记录交易行为的数据表,从上图中判断订单表与订单提成表间的连接关系是
• A.雪花模式
• B.星型模式
• C.交叉连接
• D.星座模式
从订单表到订单提成表有多条筛选路径,所以是交叉连接,所以选C

10.本题图同题9,是某公司交易相关的各表连接关系,观察下图回答以下问题: 订单表与订单提成表是以交易行为为单位展开记录的数据表,产品表与区域表是围绕产品及区域维度展开记录信息的数据表,在数据库中可以将两表合并为一个表的是
• A.产品表与订单表
• B.区域表与订单提成表
• C.订单提成表与订单表
• D.产品表与区域表

C 订单表与订单提成表有相同主键订单ID,可以合并为一个表

下方题图同题9,是某公司交易相关的各表连接关系,观察下图回答以下问题:
11.用订单提成表中的销售人员字段筛选订单表中的订单金额字段,按照求和的汇总规则计算出赵大的订单金额合计值应为
• A.9000
• B.6000
• C.3000
• D.14000
订单提成与订单间通过产品表进行跨表筛选,使用类型二的筛选计算规则,赵大有销售过abcd四款产品,所以四款产品的订单金额合计是9000,所以正确选项是A

12.用订单提成表中的销售人员字段筛选订单表中的订单金额字段,按照求和的汇总规则如果想计算出赵大的订单金额合计值为7000的结果,关于有效连接路径的正确描述应是____
• A.订单提成与订单表间的连接成为有效连接
• B.订单提成与区域表间的连接成为有效连接
• C.产品表与订单提成表间的连接成为有效连接
• D.订单提成筛选订单时无论有效连接为哪种都无法得到赵大订单金额合计值为7000的结果
通过订单ID可以直接连接订单提成与订单表,进行筛选按照类型一的方式计算结果,赵大的金额为7000,所以选A

下表是某电商某日各阶段人数统计数据,观察下表回答以下问题:学新通
13.当日UV是多少?
• A.1000
• B.700
• C.500
• D.无法计算
UV是当日到店人数统计,进入首页即为到店,所以选A

14.当日PV是多少?
A.2300
B.1000
C.1300
D.无法计算
PV是浏览量,以上数据无法统计计算,所以选D

15.当日Vistis是多少?
• A.1000
• B.700
• C.500
• D.无法计算
Vistis是浏览次数,一进一出即为一次流量,以上数据无法统计计算,所以选D

16.下表是某电商某日各阶段人数统计数据,观察下表回答以下问题:
该电商最应优先改进的行为可能是?
• A.营销方式
• B.引流方法
• C.促销活动
• D.付费流程
流失人数最多的阶段是加入购物车到完成支付,与该阶段有直接关系的行为是付费流程,所以选D

17.下图是某企业各表间的E-R关系图,根据下图回答以下问题: 学新通
根据各表中字段内容及连接关系判断上图可能描述的企业是
• A.银行
• B.电商
• C.游戏
• D.物流
上图描述的是服装电商中人货场的业务场景,所以选B

18.上图连接关系判断,上图Orderinfo可以筛选的表是
• A.Userinfo
• B.Goodsinfo
• C.Orderdetail
• D.Regioninfo
Orderinfo与Orderdetail是一对多的关系,所以选C

19.Goodsbrand表中记录了产品的品牌信息,根据上图各表内容及连接关系判断,上图中Goodsbrand不能筛选的表是
• A.Goodsinfo
• B.Orderdetail
• C.Orderinfo
• D.以上全是
Orderinfo用来连接客户一侧内容,没有展开到产品层级,所以不能与Goodsbrand产生筛选逻辑,所以选C

多选题:

1.EDIT是指数字化工作模型,以知识型业务人员的常规工作为场景,展现业务流程化、数据场景化、算法工具化、决策智能化。以下关于EDIT模型描述正确的是
• A.E指的是Exploration、探索
• B.D指的是Data、数据
• C.E指的是Experience,经验
• D.D指的是Diagnosis,诊断
AD EDIT模型:探索(Exploration)、诊断(Diagnosis)、指导(Instruction)、工具(Tool)

2.针对表格结构数据进行计算时使用的函数由哪些部分构成
• A.操作符
• B.函数表达式
• C.参数
• D.返回值
CD 操作符、函数表达式、参数、返回值都是表格结构数据中使用函数的构成部分

3.连接汇总是计算业务指标常用的计算方式,连接汇总分析过程中应尽量遵守()
• A.一表出维度
• B.一表出度量
• C.一对多的连接关系
• D.多对多的连接关系
为了保证连接后汇总结算的完整准确,需尽量使用一对多的连接关系,汇总时使用一表字段作为维度字段,所以正确答案是A、C

4.数据源中影响分析准确性的空值记录又叫做null值,关于null值描述正确的是
• A.计算机无法确保计算结果
• B.阅读者无法理解
• C.空值是空白值的简称
• D.空值行不能删除
null值可能由前端系统非必填项,如注册信息中的性别信息等产生,null值无法阅读者理解同时也无法被计算机正确识别使用。所以A、B、C是正确选项

5.INT 型数据是数据库中经常需要用到的一类数据。以下可以对 INT 型数据使用的SQL函数有()
• A.round
• B.max
• C.abs
• D.concat
ABC concat函数用来处理字符串数据

6.某数据库中t1表有city字段,在以下语句中,哪些能查询 t1 表中北京和上海的相关记录()?
• A.select * from t1 where city_name = “北京” or city_name = “上海”;
• B.select * from t1 where city_name = “北京” and city_name = " 上海";
• C.select * from t1 where city_name in (“北京”,“上海”);
• D.select * from t1 where city_name in “北京” or “上海”;
D 为语法错误,B 中 and 表示 城市名即等于“北京”且又等于“上海”的记录,不符合题意,故正确答案为 AC。

7.在SQL语言中有许多关键字代表不同数据类型以处理各类数据,以下不代表文本类型的关键字是()
• A.FLOAT
• B.INT
• C.CHAR
• D.DECIMAL
ABD FLOAT:浮点型 INT:整数 CHAR:文本型 DECIMAL:分数类型

8.数据的概括性度量分集中趋势、离散程度、偏态、峰度的度量,下列属于描述性统计中,用来度量离散程度的有()。
• A.标准差
• B.协方差
• C.四分位差
• D.异众比率
ACD 协方差是度量相关性的

9.数据分布有右偏左偏之分,关于右偏分布,下列说法正确的是( )。
• A.偏度系数小于0
• B.均值小于中位数,中位数小于众数
• C.偏度系数大于0
• D.均值大于中位数,中位数大于众数
CD 如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,则众数<中位数<平均数。 当分布对称时,离差三次方后正负离差可以相互抵消,因而偏度系数的分子等于0,则偏度系数等于0;当分布不对称时,正负离差不能抵消,就形成了正或负的偏度系数。当偏度系数为正值时,表示正离差值较大,可以判断为正偏或右偏;反之,当偏度系数为负值时,表示负离差值较大,可判断为负偏或左偏。

10.结合表名代表的业务意义判断以下可以连接在一起的表是
• A.订单表与订单详情表
• B.库存表与进货表
• C.销售表与客户表
• D.产品表与产品尺码表
B是进货业务与存货业务两个不同业务模块下的事实表相连,不同业务的事实表间需要通过共用的维度表才能连接,所以是错的,ACD都是正确选项

11.维度字段间的层级关系又称为字段间的父子级关系,以下满足父子级关系的字段是
• A.月份与星期
• B.省份与城市
• C.订单与订单详情
• D.品牌与产品
A月份对应多个星期的同时星期也属于多个不同月份,所以两者间不具备父子级关系,其他选项(BCD选项)是正确选项

12.在业务描述分析中,累计计算可以更好帮助阅读者理解业务进展程度,但并不是所有指标都适合累计计算,下列哪些指标不适合使用累计方法计算?
• A.银行存款
• B.库存金额
• C.UV
• D.销售额
AB 银行存款和库存金额本身具有累计属性,错误举例2月1日银行存款1万元,2月2日银行存款1万元,截止2月2日累计银行存款2万元

13.短视频播放平台为其他渠道进行引流服务,下列哪些方式属于短视频播放平台消耗广告库存的作弊方式
• A.以现金奖励优秀内容发布最多的制作者
• B.购买第三方程序模拟用户查看视频
• C.将完整的视频分成多个部分插入广告
• D.设置限速障碍,让用户多次刷新播放页面
BD A选项主要为鼓励用户创造更好的作品营造平台的良好环境,C选项为合理的广告消耗模式

14.预警分析帮助决策者聚焦需重点关注事项,预警分析比较适合下列哪种场景?
• A.销售额
• B.机房温度
• C.内存消耗情况
• D.客单价
BC 预警分析指的是提供当前时点对应维度的指标累计值或瞬时值,对比基准值。主要用于非常重要且敏感的指标,当这些维度下的指标值超出预警值很容易影响业务的正常运转,需预警关注。机房温度过高,设备运转速度慢,有可能造成机器损毁,线上系统无法正常运转等;内存消耗过大,计算速度慢,容易导致系统死机等。

15.在描述业务状态递进变化情况时常使用漏斗模型,那么在对漏斗模型进行分析时我们需要关注漏斗模型的哪些点
• A.体形
• B.流速
• C.体量
• D.时间
时间维度体现在漏斗模型中主要是对流速的分析,主要关注的是体形、流速及体量,所以正确答案是ABC

16.销售人员的业绩表现直接影响企业的盈利水平,以下可以用来描述销售人员业绩情况好坏的指标是
• A.同比增长率
• B.目标比差异百分比
• C.均比差异百分比
• D.标准比差异百分比
销售人员绩效过程中可以自己和自己进行同环比也可以和目标作对比,其余对比方式不适用于对销售人员业绩情况进行评估描述,所以AB是正确答案

17.数据驱动型业务决策方式作为企业重要决策方式之一受到广大企业决策者的广泛认可,以下关于数据驱动型业务描述错误的是
• A.经验为主数据为辅
• B.数据为主经验为辅
• C.数据比经验更可信
• D.经验比数据更可信
即便是数据驱动型业务决策方式,也应以经验为主数据为辅,所以BC的描述是错误的,所以答案是BC

18.饼图是业务描述性图表中的一种常见图表,关于饼图描述正确的是
• A.分项之和应是完整逻辑意义上的整体
• B.数据标签应尽量使用百分比形式展示
• C.扇区不宜过多
• D.属于结构类图表
所有选项都是饼图使用特征

19.为决策者呈现分析结果时可以以BI报表的形式或是业务分析报告的形式呈现分析结果,那么BI报表与业务分析报告的区别主要是
• A.侧重业务面的完整描述
• B.动态信息展现
• C.以图表表格为主要展现形式
• D.基于多源数据环境制作
ABCD 四个选项全部属于两者的区别内容

20.分析人员结合业务需求设计BI报表界面时应注意
• A.不放重复内容的图表
• B.根据业务逻辑有条理地进行布局
• C.汇总维度不宜过多
• D.获取信息的方式应简单直观
ABCD 所有选项都正确

这篇好文章是转载于:学新通技术网

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 学新通技术网
  • 本文地址: /boutique/detail/tanhibbfeh
系列文章
更多 icon
同类精品
更多 icon
继续加载