Статистика

Программа:

  1. Теория
    1. Основы.

      • Вероятность, среднее, дисперсия, основные теоремы и определения из теории вероятностей.
      • Основные распределения, нормальное распределение, распределения, связанные с нормальным.
      • Понятие выборки и эмпирического распределения.
      • Оценивание параметров. Метод моментов. Метод максимального правдоподобия. Доверительные интервалы.
    2. Проверка статистических гипотез.
      • Простейшие примеры (t-критерий и рядом).
      • Непараметрические методы (критерий Вилкоксона и пр.)
      • Критерии согласия: Колмогорова-Смирнова, Андерсона-Дарлинга, хи-квадрат и пр.
    3. Линейные модели.
      • Определение. Линейная регрессия. Построение доверительных интервалов для оценок параметров модели и регрессии. Выбор наилучшей модели (информационные критерии типа Акайке).
      • ANCOVA.
      • Сравнение в группах. One-way, two-way ANOVA.
  2. Практика
    1. Статистические основы анализа microarray data.
    2. P-value / E-value в BLAST
    3. NGS / Quake

Занятия проводится с использованием R и Bioconductor.