StatisticalLearning 2014 — различия между версиями
Материал из SEWiki
(→Основная) |
|||
Строка 19: | Строка 19: | ||
= Литература= | = Литература= | ||
== Основная == | == Основная == | ||
+ | # Hadley Wickham: "Advanced R" [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов | ||
+ | # Patrick Burns: "The R Inferno" [http://www.burns-stat.com/documents/books/the-r-inferno/] - "Ад R", потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R | ||
+ | # Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: "An Introduction to Statistical Learning (with Applications in R)" [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса | ||
+ | # Trevor Hastie, Robert Tibshirani, Jerome Friedman: "The Elements of Statistical Learning"[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода | ||
== Дополнительная == | == Дополнительная == |
Версия 02:35, 19 сентября 2014
Содержание
Программа
Прочитанные лекции
- Введение. Что такое statistical learning. Примеры. (05.09)
Возможные темы будущих лекций
- И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов. Категориальные переменные в регрессии. Выбор информативных признаков (немного). Выбросы, гетероскедастичность, high leverage points.
- Классификация. Линейные методы. Логистическая регрессия. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes.
- Resampling: Кросс-валидация. Бутстреп.
- Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.
- Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.
- Деревья. Bagging. Boosting.
- Support vector machines
- Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.
Результаты и итоги
Литература
Основная
- Hadley Wickham: "Advanced R" [1] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов
- Patrick Burns: "The R Inferno" [2] - "Ад R", потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R
- Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: "An Introduction to Statistical Learning (with Applications in R)" [3] - ISL, введение в SL с примерами, основное пособие курса
- Trevor Hastie, Robert Tibshirani, Jerome Friedman: "The Elements of Statistical Learning"[4] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода