第一章 描述性统计
统计分析 :包括统计描述和统计推断。
步骤:数据 ------ 描述性统计 ----- 统计推断 data statistical description statistical inference 统计描述:主要是描述样本的特征。 统计推断:参数估计,假设检验。
第一节 变量与数据
一、变量的类型:
1. 连续型变量(计量资料):取值范围为实数轴上的一个连续区间。 如: 身高 体重 脉搏 血细胞计数
计量资料 (measurement data) : 连续型变量的观察值构成的资料。
2. 离散型变量(计数资料)只能在孤立的几个数中取值的变量。如 : 二值变量 (binary variable)。也称为类别变量 (categorical variable) 或名义变量 (nominal variable)。 如: 性别 --- 男 、女
职业 --- 工 、农 、商 、学 、兵 计数资料 (count data) : 离散型变量的频数资料。
3. 有序变量(等级资料)
如: 疗效 --- 无效 、有效、显效、痊愈 等级资料(ranked data):有序变量的频数资料。
二、数据的结构和特点:
1. 基本观察单位:是按研究需要确定的采集数据的基本单位。观察对象本身可以是一个基本观察单位,也可以同时具有若干个基本观察单位。 2. 记录项目:用于统计分析的记录项目通常由分组因素、反应变量和协变量三部分组成。
表1.1 100名高血压患者治疗后的临床记录
患者编号 1 2 … 100
年龄(岁) 37 45 … 54
性别 男 女 … 女
治疗分组 A药 对照 … B药
收缩压(kPa) 18.67 20.00 … 16.80
舒张压(kPa) 11.47 12.53 … 11.73
心电图 正常 正常 … 正常
疗效判定 显效 有效 … 有效