人教版2013届高三一轮复习课时训练57:变量间的相关关系、统计案例

标签: 高三 日期: 2016-05-25 15:22:42


    




人教版 2013 届高三一轮复习课时训练 57:变量间的相关关系、统计案例

1.(2011·高考湖南卷)通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 40 20 60 爱好 20 30 50 不爱好 60 50 110 总计 n(ad-bc)2 由 k2= 算得, (a+b)(c+d)



    

(a+c)(b+d) 2 110×(40×30-20×20) ≈7.8. k2= 60×50×60×50 附表: 0.050 0.010 0.001 p(k2≥k) k 3.841 6.635 10.828 参照附表,得到的正确结论是( ) a.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关” b.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关” c.有 99%以上的把握认为“爱好该项运动与性别有关” d.有 99%以上的把握认为“爱好该项运动与性别无关” 解析:选 c.根据独立性检验的定义,由 k2≈7.8>6.635 可知我们有 99%以上的把握认为“爱好该项运动与 性别有关”,故选 c.
10 10 ^ 2. 已知变量 x, 之间具有线性相关关系, y 其回归方程为y=-3+bx, ∑xi=17, yi=4, b 的值为( 若 则 ∑ i=1 i=1

)

a.2 c.-2

b.1 d.-1

17 4 解析:选 a.依题意知, x =10=1.7, y =10=0.4, ^ 而直线y=-3+bx 一定经过点( x , y ), 所以-3+b×1.7=0.4,解得 b=2. 3.(2011·高考山东卷)某产品的广告费用 x 与销售额 y 的统计数据如下表: 4 2 3 5 广告费用 x(万元) 49 26 39 54 销售额 y(万元) ^ ^ ^ ^ 根据上表可得回归方程y=bx+a中的b为 9.4,据此模型预报广告费用为 6 万元时销售额为( a.63.6 万元 b.65.5 万元 c.67.7 万元 d.72.0 万元 4+2+3+5 7 49+26+39+54 解析:选 b.∵ x = =2, y = =42, 4 4 7 ^ ^ ^ ^ ^ 又y=bx+a必过( x , y ),∴42=2×9.4+a,∴a=9.1. ^ ∴线性回归方程为y=9.4x+9.1. ^ ∴当 x=6 时,y=9.4×6+9.1=65.5(万元). 4.下面是一个 2×2 列联表 y2 y1 总计 x1 a 21 73 x2 2 25 27 b 46 总计 则表中 a、b 处的值分别为________. 解析:∵a+21=73,∴a=52. 又∵a+2=b,∴b=54. 答案:52、54 一、选择题

)



1.下列说法中正确的有( ) ①若 r>0,则 x 增大时,y 也相应增大 ②若 r<0,则 x 增大时,y 也相应增大 ③若 r=1 或 r=-1,则 x 与 y 的关系完全对应(有函数关系),在散点图上各个点均在一条直线上 a.①② b.②③ c.①③ d.①②③ 解析:选 c.r>0,表示两个相关变量正相关,x 增大时,y 也相应增大,故①正确.r<0,表示两个变量负相 关,x 增大时,y 相应减小,故②错误.|r|越接近 1,表示两个变量相关性越高,|r|=1 表示两个变量有确定 的关系(即函数关系),故③正确. 2.下面关于 k2 说法正确的是( ) a.k2 在任何相互独立的问题中都可以用于检验有关还是无关 b.k2 的值越大,两个事件的相关性就越大 c.k2 是用来判断两个分类变量是否相关的随机变量,当 k2 的值很小时可以推断两类变量不相关 n(ad-bc) d.k2 的观测值的计算公式是 k2= (a+b)(c+d)(a+c)(b+d) 解析:选 b.k2 只适用于 2×2 型列联表问题,且 k2 只能推断两个分类变量相关,但不能推断两个变量不相 关.选项 d 中 k2 公式错误,分子上少了平方. ^ ^ ^ ^ 3.已知一组观测值(xi,yi)作出散点图后确定具有线性关系,若对于y=bx+a,求得b=0.51, x =61.75, y =38.14,则回归方程为( )

^ ^ a.y=0.51x+6.65 b.y=6.65x+0.51 ^ ^ c.y=0.51x+42.30 d.y=42.30x+0.51 ^ ^ ^ 解析:选 a.∵b=0.51,a= y -b x ≈6.65, ^ ∴y=0.51x+6.65.

4.(2011·高考陕西卷)设(x1,y1),(x2,y2),…,(xn,yn)是变量 x 和 y 的 n 个样本点,直线 l 是由这些样本 点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( ) a.x 和 y 的相关系数为直线 l 的斜率 b.x 和 y 的相关系数在 0 到 1 之间 c.当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同 d.直线 l 过点( x , y ) 解析:选 d.因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近 1,两个变 量的线性相关程度越强,所以 a,b 错误.c 中 n 为偶数时,分布在 l 两侧的样本点的个数可以不相同,所 以 c 错误.根据回归直线方程一定经过样本中心点可知 d 正确.所以选 d. 5.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果: 冷漠 不冷漠 总计 68 42 110 多看电视 20 38 58 少看电视 88 80 168 总计 则认为多看电视与人冷漠有关系的把握大约为( ) a.99% b.97.5% c.95% d.90% 解析:选 a.可计算 k2≈11.377>6.635.故选 a. 二、填空题 6.如图所示,有 5 组(x,y)数据,去掉________组数据后,剩下的 4 组数据的线性相关性最大.





解析:因为 a、b、c、e 四点分布在一条直线附近且贴近某一直线,d 点离得远.故应去掉 d 点. 答案:d ^ 7.某炼钢厂废品率 x(%)与成本 y(元/t)的线性回归方程为y=105.492+42.569x.当成本控制在 176.5 元/t 时, 可以预计生产的 1000 t 钢中,约有________t 钢是废品. 解析:∵176.5=105.492+42.569x, ∴x≈1.668, 即成本控制在 176.5 元/t 时,废品率为 1.668%. ∴生产的 1000 t 钢中,约有 1000×1.668%=16.68(t)钢是废品. 答案:16.68 8.某单位为了了解用电量 y(千瓦时)与气温 x(℃)之间的关系,随机统计了某 4 天的用电量与当天气温,并 制作了对照表: 18 13 10 气温/℃ -1 24 34 38 64 用电量/千瓦时 ^ ^ ^ ^ 由表中数据得线性回归方程y=bx+a中b=-2,预测当气温为-4 ℃时,用电量的度数约为________. 解析: x =10, y =40, ^ ∵回归方程过点( x , y ),∴40=-2×10+a. ^ ^ ∴a=60.∴y=-2x+60. ^ 令 x=-4,得y=(-2)×(-4)+60=68. 答案:68 三、解答题 9.在对人们休闲方式的一次调查中,共调查了 124 人,其中女性 70 人,男性 54 人.女性中有 43 人主要 的休闲方式是看电视,另外 27 人的休闲方式是运动;男性中有 21 人主要的休闲方式是看电视,另外 33 人 主要的休闲方式是运动. (1)根据以上数据建立一个 2×2 列联表; (2)检验性别是否与休闲方式有关,可靠性有多大 解:(1)2×2 列联表如图: 休闲方式 看电视 运动 合计 性别 43 27 70 女 21 33 54 男 64 60 124 合计 (2)假设休闲方式与性别无关,则 124×(43×33-27×21)2 k= ≈6.201>5.024, 70×54×64×60 所以有理由认为休闲方式与性别无关是不合理的,即在犯错误的概率不超过 0.025 的前提下认为休闲方式 与性别有关. 10.2011 年 3 月,日本发生了 9.0 级地震,地震引发了海啸及核泄漏.某国际组织用分层抽样的方法从心 理专家、核专家、地质专家三类专家中抽取若干人组成研究团队赴日本工作,有关数据见表 1(单位:人). 核专家为了检测当地动物受核辐射后对身体健康的影响,随机选取了 110 只羊进行了检测,并将有关数据 整理为不完整的 2×2 列联表(表 2). 表1 相关人员数 抽取人数 24 x 心理专家 48 y 核专家 72 6 地质专家 表2 高度辐射 轻微辐射 合计

身体健康 身体不健康 合计 附:临界值表 k0 2.706 3.841 5.024 6.635 7.879 10.828 0.10 0.05 0.025 0.010 0.005 0.001 p(k2≥k0) n(ad-bc)2 2 参考公式:k = (a+b)(c+d)(a+c)(b+d) (1)求研究小组的总人数; (2)写出表 2 中 a、b、c、d、e 的值,并判断有多大的把握认为羊受到高度辐射与身体不健康有关; (3)若从研究团队的心理专家和核专家中随机选 2 人撰写研究报告.求其中恰好有 1 人为心理专家的概率. 72 48 24 解:(1)依题意知 6 = y = x ,解得 y=4,x=2. 所以研究小组的总人数为 2+4+6=12. (2)根据列联表特点得 a=50-30=20,b=60-10=50,c=30+b=80,d=a+10=30,e=110. 110×(30×10-50×20)2 ≈7.486>6.635. 可求得 k2= 50×60×80×30 由临界值表知,有 99%的把握认为羊受到高度辐射与身体不健康有关. (3)设研究小组中心理专家为 a1、a2,核专家为 b1、b2、b3、b4,从中随机选 2 人,不同的选取结果有:a1a2、 a1b1、a1b2、a1b3、a1b4、a2b1、a2b2、a2b3、a2b4、b1b2、b1b3、b1b4、b2b3、b2b4、b3b4,共 15 种. 其中恰好有 1 人为心理专家的结果有:a1b1、a1b2、a1b3、a1b4、a2b1、a2b2、a2b3、a2b4,共 8 种, 8 所以恰好有 1 人为心理专家的概率 p=15. 11.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽率之间的关系进行分析研究,他们分别记录 了 12 月 1 日至 12 月 5 日的每天昼夜温差与实验室每天每 100 粒种子中的发芽数,得到如下资料: 日期 12 月 1 日 12 月 2 日 12 月 3 日 12 月 4 日 12 月 5 日 10 11 13 12 8 温差 x(℃) 发芽数 23 25 30 26 16 y(粒) 该农科所确定的研究方案是:先从这五组数据中选取 2 组,用剩下的 3 组数据求线性回归方程,再对被选 取的 2 组数据进行检验. (1)若选取的是 12 月 1 日与 12 月 5 日的两组数据,请根据 12 月 2 日至 12 月 4 日的数据,求出 y 关于 x 的 ^ 线性回归方程y=bx+a; (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过 2,则认为得到的线性回归方程 是可靠的,试问(1)中所得到的线性回归方程是否可靠 解:(1)由数据,求得 11+13+12 25+30+26 x = =12, y = =27, 3 3 30 b c a 10 d 50 60 e

∑xiyi=11×25+13×30+12×26=977,
i=1

3

∑x2=112+132+122=434, i
i=1

3

977-3×12×27 5 =2, 434-3×122 5 a= y -b x =27-2×12=-3. ^ 5 所以 y 关于 x 的线性回归方程为y=2x-3. 所以 b= ^ 5 (2)当 x=10 时,y=2×10-3=22,|22-23|<2; 同样,当 x=8 时, ^ 5 y=2×8-3=17,|17-16|<2, 所以该研究所得到的线性回归方程是可靠的.






    

Copyright © 2012-2014 免费在线文档,中国知网免费入口,论文,学习资料下载基地 Inc. 保留所有权利。

Powered by [联发文库]www.lianfasan.com | k12题库

浙icp备11013409号-1