第六章 综合练习
一、选择题
以下哪个统计指标最不容易受极端值影响?
- A. 均值
- B. 中位数
- C. 最大值
- D. 总和
数据清洗时,发现某学生成绩为 999 分,最合理的处理方式是:
- A. 直接删除该学生的所有数据
- B. 将 999 改为 0 分
- C. 标记为异常值,联系数据源核实后再处理
- D. 用全班平均分替换
想要展示"各班级期末成绩的分布情况",最合适的图表类型是:
- A. 饼图
- B. 折线图
- C. 箱线图
- D. 散点图
AI 生成的个性化训练计划,使用前最需要注意的是:
- A. 计划的排版是否美观
- B. 是否结合个人实际情况并咨询专业人士
- C. AI 使用的是哪个模型
- D. 生成速度是否够快
二、简答题
请解释"均值"和"中位数"的区别,并举例说明在什么情况下中位数比均值更能反映数据的真实情况。
AI 可以根据个人数据生成个性化方案(如训练计划、学习计划),但为什么说这些方案"仅供参考"?请从数据准确性和专业判断两个角度分析。
三、实操题
数据分析报告:收集你所在班级某次考试的成绩数据(或使用模拟数据),粘贴给 DeepSeek,要求完成数据清洗、基本统计分析和可视化图表生成。将 AI 的输出整理为一份完整的分析报告。
个性化方案:收集你自己的体测数据(或使用模拟数据),让 DeepSeek 生成一份 4 周训练计划。要求:检查方案的合理性,并针对至少一个细节进行追问优化。
(进阶)Python 可视化:在 Google Colab 中,使用 DeepSeek 帮你编写 Python 代码,将一组成绩数据绘制为柱状图和折线图。记录你与 DeepSeek 的对话过程(提示词和输出)。
参考答案(选择题):1-B 2-C 3-C 4-B