生物统计学(第五版)

更多详情

内容简介: 李春喜等编*的《生物统计学》较为系统地介绍
了生物统计学的基本原理和方法,在简要叙述了生物

计学的产生、发展及其研究对象与作用以及生物学研
究中抽样方法、试验资料的
整理、特征数的计算、概率和概率分布、抽样分布的
基础上,着重介绍平均数的统
计推断、X2检验、方差分析、直线回归与相关分析、
可直线化的非线性回归分析、
协方差分析、多元线性回归与多元相关分析、逐步回
归与通径分析和多项式回归
分析,同时对试验设计原理及对比设计、随机区组设
计、拉丁方设计、裂区设计、正
交设计等常用试验设计及其统计分析也进行了详细叙
述。
《生物统计学》可供综合性大学、师范院校生物
类及其相关专业的本科生作为教材使
用,也可作为从事生命科学、生物工程、农业科学、
林业科学、医学、畜牧兽医、水产
科学等专业的科研工作者、教师和研究生的参考书。


目录: 第五版前言
第一版前言
第一章 概论
第一节 生物统计学的概念
第二节 统计学发展概况
一、古典记录统计学
二、近代描述统计学
三、现代推断统计学
第三节 常用统计学术语
一、总体与样本
二、参数与统计数
三、变量与资料
四、因素与水平
五、处理与重复
六、效应与互作
七、准确性与精确性
八、误差与错误
第四节 生物统计学的内容与作用
思考练习题
第二章 试验资料整理与特征数计算
第一节 试验资料的搜集与整理
一、试验资料的类型
二、试验资料的搜集
三、试验资料的整理
第二节 试验资料特征数的计算
一、平均数
二、变异数
思考练习题
第三章 概率与概率分布
第一节 概率基础知识
一、概率的概念
二、概率的计算
三、概率分布
四、大数定律
第二节 几种常见的理论分布
一、二项分布
二、泊松分布
三、正态分布
第三节 统计数的分布
一、抽样试验与无偏估计
二、样本平均数的分布
三、样本平均数差数的分布
四、t分布
五、x2分布
六、F分布
思考练习题
第四章 统计推断
第一节 假设检验的原理与方法
一、假设检验的概念
二、假设检验的步骤
三、双尾检验与单尾检验
四、假设检验中的两类错误
第二节 样本平均数的假设检验
一、一个样本平均数的假设检验
二、两个样本平均数的假设检验
第三节 样本频率的假设检验
一、一个样本频率的假设检验
二、两个样本频率的假设检验
第四节 参数的区间估计与点估计
一、参数区间估计与点估计的原理
二、一个总体平均数μ的区间估计与点估计
三、两个总体平均数差数μ1一μ2的区间估计与点估计
四、一个总体频率声的区间估计与点估计
五、两总体频率差数P1-Pt的区间估计与点估计
第五节 样本方差的同质性检验
一、一个样本方差的同质性检验
二、两个样本方差的同质性检验
三、多个样本方差的同质性检验
思考练习题
第五章 X2检验
第一节 X2检验的原理与方法
第二节 适合性检验
第三节 独立性检验
一、2×2列联表的独立性检验
二、2×c列联表的独立性检验
三、r×c列联表的独立性检验
思考练习题
第六章 方差分析
第一节 方差分析的基本方法
一、方差分析的基本原理
二、数学模型
三、平方和与自由度的分解
四、统计假设的显著性检验——F检验
五、多重比较
第二节 单因素方差分析
一、组内观测次数相等的方差分析
二、组内观测次数不相等的方差分析
第三节 二因素方差分析
一、无重复观测值的二因素方差分析
二、具有重复观测值的二因素方差分析
第四节 多因素方差分析
第五节 方差分析缺失数据的估计
一、缺失一个数据的估计方法
二、缺失两个数据的估计方法
第六节 方差分析的基本假定和数据转换
一、方差分析的基本假定
二、数据转换
思考练习题
第七章 直线回归与相关分析
第一节 回归和相关的概念
第二节 直线回归分析
一、直线回归方程的建立
二、直线回归的数学模型和基本假定
三、直线回归的假设检验
四、直线回归的区间估计
五、直线回归的应用及注意问题
第三节 直线相关
一、相关系数和决定系数
二、相关系数的假设检验
三、相关系数的区间估计
四、应用直线相关的注意事项
思考练习题
第八章 可直线化的非线性回归分析
第一节 非线性回归的直线化
一、曲线类型的确定
二、数据变换的方法
第二节 倒数函数曲线
第三节 指数函数曲线
第四节 对数函数曲线
第五节 幂函数曲线
第六节 Logistic生长曲线
一、Loglslic生长曲线的由来和基本特征
二、Logmtic生长曲线方程的配合
思考练习题
第九章 试验设计及其统计分析
第一节 试验设计的基本原理
一、试验设计的意义
二、生物学试验的基本要求
三、试验设计的基本要素
四、试验误差及其控制途径
五、试验设计的基本原则
第二节 对比设计及其统计分析
一、对比设计
二、对比设计试验结果的统计分析
第三节 随机区组设计及其统计分析
一、随机区组设计
二、随机区组设计试验结果的统计分析
第四节 拉丁方设计及其统计分析
一、拉丁方设计
二、拉丁方设计试验结果的统计分析
第五节 裂区设计及其统计分析
一、裂区设计
二、裂区设计试验结果的统计分析
第六节 正交设计及其统计分析
一、正交表及其特点
二、正交试验的基本方法
三、正交设计试验结果的统计分析
思考练习题
第十章 协方差分析
第一节 协方差分析的作用
一、降低试验误差,实现统计控制
二、分析不同变异来源的相关关系
三、估计缺失数据
第二节 单因素试验资料的协方差分析
一、计算变量各变异来源的平方和、乘积和与自由度
二、检验x和y是否存在直线回归关系
三、检验矫正平均数□间的差异显著性
四、矫正平均数□间的多重比较
第三节 二因素试验资料的协方差分析
一、乘积和与自由度的分解
二、检验x和y是否存在直线回归关系
三、检验矫正平均数□间的差异显著性
第四节 协方差分析的数学模型和基本假定
一、协方差分析的数学模型
二、协方差分析的基本假定
思考练习题
第十一章 多元线性回归与多元相关分析
第一节 多元线性回归分析
一、多元线性回归模型
二、多元线性回归方程的建立
三、多元线性回归的假设检验和置信区间
第二节 多元相关分析
一、多元相关分析
二、偏相关分析
思考练习题
第十二章 逐步回归与通径分析
第一节 逐步回归分析
一、逐个淘汰不显著自变量的回归方法
二、逐个选人显著自变量的回归方法
第二节 通径分析
一、通径与通径系数的概念
二、通径系数的求解方法
三、通径分析的假设检验
思考练习题
第十三章 多项式回归分析
第一节 多项式回归的数学模型
第二节 多项式回归方程的建立
一、多项式回归方程的建立与求解
二、多项式回归方程的图示
第三节 多项式回归方程的假设检验
第四节 相关指数
第五节 正交多项式回归分析
一、正交多项式回归分析原理
二、正交多项式回归分析示例
思考练习题
主要参考文献
附表
索引

书摘: 第一章
概 论
本章提要
生物统计学是把数学的语言引入具体的生命科学领域 ,运用数理统计的原理和方法对生物有机体开展调查和试验 ,目的是以样本的统计数估计总体的参数 ,对所研究的总体进行合理的推论 .生物统计学主要包括试验设计和统计分析两部分内容,其作用主要有4个方面 :提供整理、描述数据资料的科学方法并确定其数量特征 ,判断试验结果的可靠性 ,提供由样本推断总体的方法 ,提供试验设计的原则 .统计学的发展经历了古典记录统计学、近代描述统计学和现代推断统计学3个阶段 .本章还介绍了统计学中几组常用的术语 .
第一节 生物统计学的概念
统计学 (statistics)是把数学的语言引入具体的科学研究领域 ,将所研究的问题抽象为数学问题的过程 ,是搜集、分析和解释数据的一门科学 .生物统计学 (biostatistics)是数理统计 (mathematicalstatistics)在生物学研究中的应用 ,它是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科 ,属于应用统计学的一个分支.随着生物学研究的不断发展 ,生物统计学的应用也越来越广泛 .
生物学研究的对象是生物有机体 ,与非生物相比 ,它具有特殊的变异性、随机性和复杂性 .生物有机体的生长发育、生理活动、生化变化及有机体受外界各种随机因素的影响等,都使生物学研究的试验结果有较大的差异性 ,这种差异性往往会掩盖生物体本身的特殊规律 .在生物学研究中 ,大量试验资料内在的规律性也容易被杂乱无章的数据所迷惑 ,从而被人们忽视 .因此 ,在生物学研究中 ,应用生物统计学就显得特别重要 .生物学研究的实践证明 ,只有正确地应用生物统计学的原理和分析方法对生物学试验进行合理设计 ,对数据进行客观分析 ,才能得出科学的结论 .
生物统计学是在生物学研究过程中 ,逐渐与数学的发展相结合而形成的 ,它是应用数学的一个分支 ,属于生物数学的范畴 .生物统计学是把数学的方法引入具体的生命科学
领域,把生命科学领域中具体的研究问题抽象为数学问题,从大量试验数据中探寻其规律的过程,以数学的概率论和数理统计为基础,涉及数列、排列、组合、矩阵、微积分等知识.作为一门工具课,生物统计学一般不过多讨论数学原理,而主要偏重于统计原理的介绍和具体分析方法的应用.
第二节 统计学发展概况
人类的统计实践是随着记数活动而产生的.因此,对统计发展的历史可追溯到远古的原始社会.但是,使人类的统计实践上升到理论予以总结和概括成一门系统的统计学,起源于17世纪英国,其代表人物W.Pet
y(1623~1687)是政治算术学派的奠基人,代表作是.政治算术..政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究,为统计学的发展开辟了广阔的前景.由于W.Pet
y对统计学的形成有着巨大的贡献,马克思称他为“统计学的创始人”.统计学的发展经历了古典记录统计学、近代描述统计学和现代推断统计学3个阶段.
一、古典记录统计学
古典记录统计学(recordsatistics)形成于17世纪中叶至19世纪中叶.在最初兴起时,通过用文字或数字如实记录与分析国家社会经济状况,初步建立了统计研究的方法和规则.概率论被引进之后,逐渐成为一种较为成熟的方法.
瑞士数学家J..Bernoul
i(1654~1705)系统论证了大数定律.后来,J..Bernoul
i的后代 D..Bernoul
i(1700~1782)将概率论的理论应用到医学和人类保险.
法国天文学家、数学家、统计学家 P..S..Laplace(1749~1827)发展了概率论的研究,建立了严密的概率数学理论,并在天文学、物理学的研究中进行了推广应用.他研究了最小二乘法,提出了“拉普拉斯定理”(中心极限定理的一部分),初步建立了大样本推断的理论基础,为后人开创了抽样调查的方法.
正态分布理论对研究生物统计学的理论十分重要,它最早是由法国数学家 De Moiver于1733年发现的.德国天文学家和数学家 G..F..Gaus
(1777~1855)在研究观察误差理论时,也独立推导出测量误差的概率分布方程,并提出了“误差分布曲线”.这条分布曲线称为 Gaus
分布曲线,也就是正态分布曲线.
二、近代描述统计学
近代描述统计学(descriptionstatistics)形成于19世纪中叶至20世纪上半叶,这个时期也是统计学应用于生物学研究的开始和发展时期,其“描述”特色是由一批原来研究生物进化的学者们提炼而成的.英国遗传学家F.Galton(1822~1911)自1882年起开设 “人体测量实验室”,分析父母与子女的变异,探寻其遗传规律,应用统计方法研究人种特性和遗传,探索了能把大量数据加以描述与比较的方法和途径,引入了中位数、百分位数、四分位数,以及分布、相关、回归等重要的统计学概念与方法,开辟了生物学研究的新领域.尽管他的研究当时并未成功,但由于他开创性地将统计方法应用于生物学研究,后人推崇他为生物统计学的创始人.
F.Galton和他的继承人 K..Pearson(1857~1936)经过共同努力于1895年成立了伦

敦大学生物统计实验室,1889年发表了 .自然界的遗传.一文,并于1901年创办了 B
kaitomer
(.生物统计学报.或 .
生物计量学报 .)
这一权威杂志.在该杂志的创刊词中,n首次为他们所运用的统计方法明确提出了“生物统计”(biometry)就是应用于生物学科中的统计方法.在 .自然
F.Galton和K.P
earso
一词,F.Galton解释为:所谓生物统计学,
界的遗传.一文中,K..Pearson提出了相关与回归分析问题,并给出了简单相关系数和复相关系数的计算公式.1900年,K..Pearson在研究样本误差效应时,提出了χ2检验,它在属性资料的统计分析中有着广泛的应用.
三、现代推断统计学
现代推断统计学(s)形成于20世纪初至20世纪中叶.随着社会科
inferencestatistic学和自然科学领域研究的不断深入,各种事物与现象之间繁杂的数量关系以及一系列未知的数量变化,单靠记录或描述的统计方法已难以奏效.因此,要求采用推断的方法来掌握事物之间的真正联系并对事物进行预测.从描述统计学到推断统计学,这是统计学发
展过程中的一个巨大飞跃.
K..Pearson的学生 W..S..Gos
et(1876~1937)对样本标准差进行了大量研究,于
kaiitomer
1908年以笔名“Student”在B
杂志上发表了论文.平均数的概率误差.,创立了
小样本检验的理论和方法,即t分布和t检验法.t检验已成为当代生物统计工作的基本工具之一,它也为多元分析的理论形成和应用奠定了基础.因此,许多统计学家把1908年看成是统计推断理论发展史上的里程碑,也有人推崇W.S.Gos
et为推断统计学(尤其是小样本研究理论)的先驱者.
英国统计学家 R..A..Fisher(1890~1962)于1923年发展了显著性检验及估计理论,提出了F分布和F检验,创立了方差和方差分析.在从事农业试验及数据分析研究时,他提出了随机区组法、
拉丁方法和正交试验的方法.1915年,R.A.Fisher在 B
kaiitomer
上发表论文.无限总体样本相关系数值的频率分布.,被称为现代推断统计学的第一篇论文.1925年,R.A.Fisher发表了.试验研究工作中的统计方法.,对方差分析及协方差分析进一步作了完整的解释,从而推动和促进了农业科学、生物学及遗传学的研究与发展.自方差分析问世以来,各种数理统计方法不但在实验室中成为研究人员的析因工具,而且在田间试验、饲养试验、临床试验等农学、医学和生物学领域也得到了广泛应用.
J..Newman(1894~1981)和 E..S..Pearson进行了统计理论的研究工作,分别于1936年和1938年提出了一种统计假设检验学说.假设检验和区间估计作为数学上的最优化问题,对促进统计理论研究和对试验作出正确结论具有非常实用的价值.
另外,P..C..Mabeilinrobis对作物抽样调查、A..Waecl对序贯抽样、K..Mather对群体遗传学、F..Yates对田间试验设计等都作出了杰出的贡献.
我国对生物统计学的应用始于1913年顾澄教授翻译的英国统计学家G.U.Yule在1911年出版的关于描述统计学的名著.统计学之理论.,这标志着英国、美国数理统计学传入中国的开始.之后,许多生物学研究工作者积极从事统计学理论和实践的应用研究,使生物统计学在农业科学、医学科学、生物学、遗传学、生态学等学科领域发挥了重要作用.应用试验设计方法和统计分析理论 ,进行农作物品种产量比较试验、病虫害的预测预报、动物饲养试验、饲料配方、毒理试验、动植物资源的调查与分析、动植物育种中遗传资源及亲代和子代遗传的分析等都取得了较好成果 .
近年来 ,生物统计学发展迅速 ,从中又分支出群体遗传学、生态统计学、生物分类统计学、毒理统计学等 .由于数学与生物学、医学和农学的应用 ,使生物数学成为一门新的学科,生物统计学只是它的一个分支学科 .1974年,联合国教育、科学及文化组织在编制学科分类目录时 ,第一次把生物数学作为一门独立的学科列入生命科学类中 .随着计算机的普及和网络技术的发展 ,SAS(statisticalanalysissystem)、 SPSS(statisticalpackagefor thesocialscience)等国际通用统计软件的开发和应用 ,以及生命科学研究领域的不断深入,生物统计学的研究和应用必将越来越广泛 ,越来越深入 .
第三节 常用统计学术语
一、总体与样本
具有相同性质的个体所组成的集合称为总体 (population),它是指研究对象的全体 ,而组成总体的基本单元称为个体 (.
individual)
总体按所含个体的数目可分为有限总体和无限总体 .个体极多或无限多的总体称为无限总体 (infinitepopulation).例如 ,某一棉田棉铃虫的头数 ,可以认为是无限总体 .另外 ,也可从抽象意义上来理解无限总体 .例如 ,通过临床试验来推断某种药品比另一种药品治愈率高 ,这里无限总体是指一个理论性总体 .个体有限的总体称为有限总体 (finite population).例如 ,对某一班学生身高进行调查 ,这时总体是指这一班中每位学生的身高 .
要研究总体的性质 ,一般情况下我们无法对总体中的个体全部取出进行调查或研究 .因为在实际研究过程中 ,常会遇到两种难以克服的困难 :一是总体的个体数目较多 ,甚至无限多 ;二是总体的数目虽然不多 ,但试验具有破坏性 ,或者试验费用很高 ,不允许做更多的试验 .在这种情况下 ,只能采取抽样的方法 ,从总体中抽取一部分个体进行研究 .
从总体中抽出的若干个体所构成的集合称为样本 (sample),构成样本的每个个体称为sampleunisamplesiz
样本单位 (t),样本中个体的数目称为样本容量 (e),记为 n.样本的作用在于估计总体 .例如 ,可以调查某一地区棉田100株棉花上的棉铃虫头数 ,来推断该地区棉铃虫的发生状况 ,以采取相应的对策 .一般在生物学研究中 ,n<30的样本称为小样本 , n≥30的样本称为大样本 .在一些计算和分析检验方法上 ,大、小样本是不同的 .
在对事物的研究过程中 ,人们常通过某事物的一部分 (样本 )来估计事物全部 (总体 )的特征 ,目的是为了以样本的特征对未知总体进行推断 ,从特殊推导一般 ,对所研究的总体作出合乎逻辑的推论 ,得到对客观事物的本质和规律性的认识 .在生物学研究中 ,我们所期望的是总体 ,而不是样本 .但是在具体的试验过程中 ,我们所得到的却是样本而不是总体 .因此,从某种意义上讲 ,生物统计学是