11.3 变量间的相关关系、统计案例练习题

标签: 关系 相关 日期: 2016-05-25 15:22:45


    


§11.3 变量间的相关关系、统计案例
一、选择题 1.有五组变量: ①汽车的重量和汽车每消耗 1 升汽油所行驶的平均路程; ②平均日学习时间和平均学习成绩; ③某人每日吸烟量和身体健康情况; ④圆的半径与面积; ⑤汽车的重量和每千米耗油量. 其中两个变量成正相关的是( ) a.①③ b.②④ c.②⑤ d.④⑤ 解析 由变量的相关关系的概念知,②⑤是正相关,①③是负相



    

关,④为函数关 系, 故选 c. 答案 c 2.通过随机询问 110 名不同的大学生是否爱好某项运动,得到如下的列联表: 男 爱好 不爱好 总计 由k
2

女 20 30 50

总计 60 50 110

40 20 60

2 n(ad bc) 2 110 (40 30 20 30) 2 算得,k 7.8 (a b)(c d )(a c)(b d ) 60 50 60 50

附表:
p( k 2 k )

0.050 0.010

0.001

k

3.841 6.635 10.828 )

参照附表,得到的正确结论是(

a.有 99%以上的把握认为“爱好该项运动与性别有关” b.有 99%以上的把握认为“爱好该项运动与性别无关” c.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关” d.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关” 解析 由 k 7.8 6.635 ,而 p( k 2 6.635) 0.010 ,
2

故由独立性检验的意义可知选 a. 答案 a

3.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患 肺癌有关”的结论,并且有 99%以上的把握认为这个结论是成立的,则下列说法 中正确的是( ).

a.100 个吸烟者中至少有 99 人患有肺癌 b.1 个人吸烟,那么这人有 99%的概率患有肺癌 c.在 100 个吸烟者中一定有患肺癌的人 d.在 100 个吸烟者中可能一个患肺癌的人也没有 解析 生. 答案 d 4.设(x1,y1),(x2,y2),,(xn,yn)是变量 x 和 y 的 n 个样本点,直线 l 是由 这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是 ( ). 统计的结果只是说明事件发生可能性的大小,具体到一个个体不一定发

a.直线 l 过点( x , y ) b.x 和 y 的相关系数为直线 l 的斜率 c.x 和 y 的相关系数在 0 到 1 之间 d.当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同 解析 由样本的中心( x , y )落在回归直线上可知 a 正确; 和 y 的相关系数表 x 示为 x 与 y 之间的线性相关程度,不表示直线 l 的斜率,故 b 错;x 和 y 的相关 系数应在-1 到 1 之间,故 c 错;分布在回归直线两侧的样本点的个数并不绝对 平均,即无论样本点个数是奇数还是偶数,故 d 错. 答案 a 5.某产品的广告费用 x 与销售额 y 的统计数据如下表: 广告费用 x(万元) 销售额 y(万元) 4 49 2 26 3 39 5 54

根据上表可得回归方程^=^x+^中的^为 9.4,据此模型预报广告费用为 6 万元 y b a b

时销售额为( a.63.6 万元 c.67.7 万元 解析

). b.65.5 万元 d.72.0 万元

x=

4+2+3+5 =3.5(万元), 4

y=

49+26+39+54 =42(万元), 4

∴^= y -^ x =42-9.4×3.5=9.1, a b ^ ∴回归方程为y=9.4x+9.1, ∴当 x=6(万元)时,^=9.4×6+9.1=65.5(万元). y 答案 b 6.已知数组(x1,y1),(x2,y2),,(x10,y10)满足线性回归方程^=bx+a,则 y

x1+x2++x10 “(x0 , y0) 满 足 线 性 回 归 方 程 ^ = bx + a” 是 “x0 = y , y0 = 10 y1+y2++y10
10 ”的( ). b.必要不充分条件 d.既不充分也不必要条件

a.充分不必要条件 c.充要条件

解析 x0,y0 为这 10 组数据的平均值,又因为线性回归方程^=bx+a 必过样本 y 中心( x , y ),因此( x , y )一定满足线性回归方程,但满足线性回归方程的 除了( x , y )外,可能还有其他样本点. 答案 b 7.在第 29 届奥运会上,中国健儿取得了 51 金、21 银、28 铜的好成绩,稳居世 界金牌榜榜首, 由此许多人认为中国进入了世界体育强国之列,也有许多人持反 对意见.有网友为此进行了调查,在参加调查的 2 548 名男性公民中有 1 560 名持反对意见,2 452 名女性公民中有 1 200 人持反对意见,在运用这些数据说 明中国的奖牌数是否与中国进入体育强国有无关系时,用什么方法最有说服力 ( a.平均数与方差 b.回归直线方程 ).

c.独立性检验

d.概率

解析 由于参加讨论的公民按性别被分成了两组, 而且每一组又被分成了两种情 况:认为有关与无关,故该资料取自完全随机统计,符合 2×2 列联表的要求, 故用独立性检验最有说服力. 答案 c 二、填空题 8. 在一组样本数据(x1,y1)(x2,y2) , ,, xn,yn) n≥2,x1,x2,,xn 不全 ( ( 1 相等)的散点图中,若所有样本点(xi,yi)(i=1,2,,n)都在直线 y= x+1 上, 2 则这组样本数据的样本相关系数为________. 解析 根据样子相关系数的定义可知,当所有样本点都在直线上时,相关系数 为 1. 答案 18 9.某医疗研究所为了检验某种血清预防感冒的作用,把 500 名使用血清的人与 另外 500 名未使用血清的人一年中的感冒记录作比较,提出假设 h0:“这种血清 不能起到预防感冒的作用”, 利用 2×2 列联表计算得 k2≈3.918,经查临界值表 知 p(k2≥3.841)≈0.05.则下列结论中,正确结论的序号是________. ①有 95%的把握认为“这种血清能起到预防感冒的作用”; ②若某人未使用该血清,那么他在一年中有 95%的可能性得感冒; ③这种血清预防感冒的有效率为 95%; ④这种血清预防感冒的有效率为 5%. 解析 k2≈3.918>3.841, p(k2≥3.841)≈0.05,所以有 95%的把握认为“这种 而 血清能起到预防感冒的作用”; 但检验的是假设是否成立和该血清预防感冒的有 效率是没有关系的,不是同一个问题,不要混淆,正确序号为①. 答案 ① 10. 调查了某地若干户家庭的年收入 x(单位: 万元)和年饮食支出 y(单位: 万元), 调查显示年收入 x 与年饮食支出 y 具有线性相关关系,并由调查数据得到 y 对 x ^ 的回归直线方程:y=0.254x+0.321,由回归直线方程可知,家庭年收入每增加 1 万元,年饮食支出平均增加________万元. 解析 由题意,知其回归系数为 0.254,故家庭年收入每增加 1 万元,年饮食支 出平均增加 0.254 万元. 答案 0.254 11.某小卖部为了了解热茶销售量 y(杯)与气温 x(℃)之间的关系,随机统计了

某 4 天卖出的热茶的杯数与当天气温,并制作了对照表: 气温(℃) 杯数 18 24 13 34 10 38 -1 64

由表中数据算得线性回归方程^=bx+a 中的 b≈-2,预测当气温为-5 ℃时, y 热茶销售量为________杯(已知回归系数

解析

1 1 根据表格中的数据可求得 x = ×(18+13+10-1)=10, y = ×(24+ 4 4

34+38+64)=40(杯). ∴a= y -b x =40-(-2)×10=60, ∴^=-2x+60,当 x=-5 时, y ^=-2×(-5)+60=70(杯). y 答案 70 12. 某医疗研究所为了了解某种血清预防感冒的作用,把 500 名使用过血清的人 与另外 500 名未使用血清的人一年中的感冒记录作比较,提出假设 h0:“这种血 清不能起到预防感冒的作用”, 利用 2×2 列联表计算得 k2≈3.918,经查临界值 表知 p(k2≥3.841)≈0.05.则下列结论中,正确结论的序号是________. ①有 95%的把握认为“这种血清能起到预防感冒的作用”; ②若某人未使用该血清,那么他在一年中有 95%的可能性得感冒; ③这种血清预防感冒的有效率为 95%; ④这种血清预防感冒的有效率为 5%. 解析 因为 k2≈3.918≥3.841,而 p(k2≥3.814)≈0.05,所以有 95%的把握认为 “这种血清能起到预防感冒的作用”. 要注意我们检验的是假设是否成立和该血 清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆. 答案 ①

三、解答题 13. 在某地区的 12~30 岁居民中随机抽取了 10 个人的身高和体重的统计资料如 表: 身高(cm) 体重(kg) 143 41 156 49 159 61 172 79 165 68 171 69 177 74 161 69 164 68 160 54

根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系. 解析 以 x 轴表示身高,y 轴表示体重,可得到相应的散点图如图所示:

由散点图可知,两者之间具有相关关系,且为正相关. 14.某地最近十年粮食需求量逐年上升,下表是部分统计数据: 年份 2002 2004 246 2006 257 2008 276 2010 286

需求量 (万吨) 236

(ⅰ)利用所给数据求年需求量与年份之间的回归直线方程 y bx a ; (ⅱ)利用(ⅰ)中所求出的直线方程预测该地 2012 年的粮食需求量。

15.有甲、乙两个班级进行数学考试,按照大于等于 85 分为优秀,85 分以下为 非优秀统计成绩后,得到如下的列联表. 优秀 甲班 乙班 合计 2 已知从全部 105 人中随机抽取 1 人为优秀的概率为 . 7 (1)请完成上面的列联表; (2)根据列联表的数据,若按 95%的可靠性要求,能否认为“成绩与班级有关 系”; (3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的 10 名学生从 2 到 11 进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的 序号.试求抽到 6 号或 10 号的概率. 10 30 105 非优秀 总计

n ad-bc 2 附 k= , a+b c+d a+c b+d
2

解析 (1) 优秀 甲班 乙班 合计 (2)根据列联表中的数据,得到 10 20 30 非优秀 45 30 75 总计 55 50 105

k=

105× 10×30-20×45 55×50×30×75

2

≈6.109>3.841,

因此有 95%的把握认为“成绩与班级有关系”. (3)设“抽到 6 号或 10 号”为事件 a,先后两次抛掷一枚均匀的骰子,出现的点 数为(x,y),则所有的基本事件有(1,1)、(1,2)、(1,3)、、(6,6),共 36 个. 事件 a 包含的基本事件有(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5), (6,4),共 8 个,∴p(a)= 8 2 = . 36 9

16.地震、海啸、洪水、森林大火等自然灾害频繁出现,紧急避险常识越来越引 起人们的重视. 某校为了了解学生对紧急避险常识的了解情况,从七年级和八年 级各选取 100 名同学进行紧急避险常识知识竞赛.图 k55-2(1)和图 k55-2(2) 分别是对七年级和八年级参加竞赛的学生成绩按[40,50),[50,60),[60,70), [70,80]分组,得到的频率分布直方图.

图 k55-2 (1)分别计算参加这次知识竞赛的两个年级学生的平均成绩;(注:统计方法中, 同一组数据常用该组区间的中点值作为代表) (2)完成下面 2×2 列联表,并回答是否有 99%的把握认为“两个年级学生对紧急 避险常识的了解有差异”

成绩小于 60 分人 数 七年级 八年级 合计

成绩不小于 60 分人 数

合计

n ad-bc 2 附:k = .临界值表: a+b c+d a+c b+d p(k2≥k) 0.10 0.05 0.010 k 2.706 3.841 6.635
2

解析 (1)七年级学生竞赛平均成绩为 (45×30+55×40+65×20+75×10)÷100=56(分), 八年级学生竞赛平均成绩为 (45×15+55×35+65×35+75×15)÷100=60(分). (2)2×2 列联表如下: 成绩小于 60 分人 成绩不小于 60 分人数 合计 数 七年级 70 30 100 八年级 50 50 100 合计 120 80 200 2 200× 50×30-50×70 ∴k2= ≈8.333>6.635, 100×100×120×80 ∴有 99%的把握认为“两个年级学生对紧急避险常识的了解有差异”.




    

Copyright © 2012-2014 免费在线文档,中国知网免费入口,论文,学习资料下载基地 Inc. 保留所有权利。

Powered by [联发文库]www.lianfasan.com | k12题库

浙icp备11013409号-1