生物统计

统计学基础和概率论基础

Posted by lifanchen on March 9, 2019

中心趋势的描述性统计测量

Key words: Descriptive Statistic, measure of central tendency ,statistic, parameter, mean(μ) ,median, mode

  • 统计量:它是根据样本数据计算的描述性度量。一般的流程是构建统计量去估计总体的参数!

  • 参数: 它是根据总体数据计算的描述性度量。

  • n :代表样本的数量。

  • N:代表总体的数量。

  • 描述中心趋势的统计量有:平均数、中位数、众数、偏度(skewness)

  • 平均数(mean): 数据的平均值。

    • 特点:

      1. 唯一性
      2. 简单性 3. 易受极端值的影响
  • 中位数(median): 唯一性,简单性,不易受极端值的影响

  • 众数(mode): 有时它并不是唯一的,它可用于描述定性数据。

  • 对称性(Symmetric): 如果数据的直方图的左半部分大致是其右半部分的镜像,则数据是对称的。

  • 偏移(Skewed): 如果数据不对称,并且数据延伸到一侧的程度大于另一侧,则数据会发生偏斜。

    偏移

分散度的描述性统计量

Key wordsDescriptive Statistic, measure of dispersion , range ,variance, coefficient of variation.

  • 分散度(dispersion):分散度量传达关于一组数据中存在的可变性的信息。
    1. If all the values are the same → There is no dispersion .

    2. If all the values are different → There is a dispersion:
    3. If the values close to each other →The amount of Dispersion small.
    4. If the values are widely scattered → The Dispersion is greater.
  • 分散度的描述:

    1. Range (R).

    2. Variance.
    3. Standard deviation.
    4. Coefficient of variation (C.V).
  • 范围(range): Range = Largest value- Smallest value

  • 方差(variance):

    • 总体方差:

    • 样本方差:

  • 变异系数/The Coefficient of Variation (C.V) :它是用于比较两组数据中的分散度,其与 测量单位无关

概率论—统计推断的基础

Key words: Probability, Objective Probability,Subjective Probability, Equally likely,Mutually exclusive, Multiplicative rule,Conditional Probability, Marginal probability, Independent events, Bayes theorem .

  • 等价(Equally likely outcomes): 事件有着相同的发生概率。
  • 互斥事件(Mutually exclusive): 两个事件不可能同时发生。
  • 全集(The universal Set (S)): 所有能够发生事件的集合。
  • 空集(empty set) :Φ。
  • 古典概型(Classical Probability): 古典概型也叫传统概率、其定义是由法国数学家拉普拉斯 (Laplace ) 提出的。 如果一个随机试验所包含的单位事件是有限的,且每个单位事件发生的可能性均相等,则这个随机试验叫做拉普拉斯试验,这种条件下的概率模型就叫古典概型。 在这个模型下,随机实验所有可能的结果是有限的,并且每个基本结果发生的概率是相同的。

  • 相对频率(Relative Frequency Probability: ) 另一种经典的概率方法是相对频率,即单个事件的发生与结果总数的比率。 这是一种在收集数据后经常使用的工具。 您可以将数据的单个部分与收集的数据总量进行比较。
  • 主观概率(Subjective Probability)主观概率是一种概率,来源于个人对特定结果是否可能发生的个人判断。 它不包含正式的计算,只反映了主题的观点和过去的经验。

概率的基本属性

概率的计算规则

  1. 加法规则

  2. 如果事件A和B互斥,那么加法法则简化成:

  3. 互补规则:

概率期望

期望是线性的

  1. 离散随机变量的期望:
  1. 连续随机变量的期望:
  1. 方差(二阶矩 second moments)的计算:

  2. n 阶矩:

  3. n阶中心矩:

  4. 累积矩(Cumulant ):

条件概率

乘法公式 Multiplicative Rule

P(A),P(B):边际概率(marginal probability )

全概率 formula of total probability

全概率: 由所有已知(n个)原因B推断结果A

全概率

独立事件

事件A对事件B的发生没有影响。

边际概率

贝叶斯公式

全概率公式“由原因推结果”; 而贝叶斯公式“由结果推原因”