<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
		<id>http://mit.spbau.ru/sewiki/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Korobeynikov</id>
		<title>SEWiki - Вклад участника [ru]</title>
		<link rel="self" type="application/atom+xml" href="http://mit.spbau.ru/sewiki/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Korobeynikov"/>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php/%D0%A1%D0%BB%D1%83%D0%B6%D0%B5%D0%B1%D0%BD%D0%B0%D1%8F:%D0%92%D0%BA%D0%BB%D0%B0%D0%B4/Korobeynikov"/>
		<updated>2026-04-07T18:52:59Z</updated>
		<subtitle>Вклад участника</subtitle>
		<generator>MediaWiki 1.26.2</generator>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0_2015&amp;diff=5486</id>
		<title>Статистика 2015</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0_2015&amp;diff=5486"/>
				<updated>2015-02-20T00:11:44Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Фрагменты теории вероятностей */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Лекции - Антон Коробейников (&amp;lt;b&amp;gt;anton@korobeynikov.info&amp;lt;/b&amp;gt;)&lt;br /&gt;
&lt;br /&gt;
Практика - Александр Шлемов (&amp;lt;b&amp;gt;ShlemovAlex@gmail.com&amp;lt;/b&amp;gt;) &lt;br /&gt;
&lt;br /&gt;
= Предварительная программа =&lt;br /&gt;
== Фрагменты теории вероятностей ==&lt;br /&gt;
# Геометрическая вероятность. Пример (множество Витали). Непрерывная вероятность. ''(13.02.2015)''&lt;br /&gt;
# Базовые вещи: пространство элементарных исходов, сигма-алгебра (для галочки), вероятность. &lt;br /&gt;
# Случайная величина. Распределение случайной величины. Плотность. Функция распределения. Свойства.&lt;br /&gt;
# Распределения случайных векторов. Плотность. Ф.р. &lt;br /&gt;
# Независимость случайных величин&lt;br /&gt;
# Преобразования с.в. - сумма, произведение. Смеси. Формула полной вероятности.&lt;br /&gt;
# Классические распределения&lt;br /&gt;
# Среднее, дисперсия, корреляция, медиана. Свойства. &lt;br /&gt;
# Сходимость распределений. Почти наверное, по вероятности, слабая (по распределению). Связь. Примеры.&lt;br /&gt;
# ЗБЧ, ЦПТ&lt;br /&gt;
&lt;br /&gt;
== Элементарная статистика ==&lt;br /&gt;
# Понятие выборки. Эмпирическое распределение&lt;br /&gt;
# Понятие характеристик. Эмпирические и генеральные характеристики&lt;br /&gt;
# Оценки. Свойства. Понятия несмещенности, состоятельности. Способы построения оценок: метод подстановки (моментов), метод максимум правдоподобия &lt;br /&gt;
# Доверительные интервалы. Понятие. Примеры: доверительные интервалы для среднего и дисперсии в нормальной модели, асимптотические доверительные интервалы исходя из ЦПТ&lt;br /&gt;
# Проверка гипотез&lt;br /&gt;
&lt;br /&gt;
== Домашние задания по практике ==&lt;br /&gt;
* К.р. по статистике [[Файл:work_stat.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Результаты и итоги ==&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Чернова Н. И. [http://www.nsu.ru/mmf/tvims/chernova/tv/index.html Теория вероятностей]: Учеб. пособие / Новосиб. гос. ун-т. Новосибирск, 2007. 160 с.&lt;br /&gt;
# Гнеденко Б. В. Курс теории вероятностей. 8-е изд., испр. и доп.—М.: Едиториал УРСС, 2005.— 448 с. &lt;br /&gt;
# Чернова Н. И. [http://www.nsu.ru/mmf/tvims/chernova/ms/index.html Математическая статистика]: Учеб. пособие / Новосиб. гос. ун-т. Новосибирск, 2007. 148 с.&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# Некруткин В.В. Распределения одномерных случайных величин. [http://statmod.ru/wiki/_media/books:vv:comments_one_dim_distributions_2013_1.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Некруткин В.В. Распределения случайных векторов [http://statmod.ru/wiki/_media/books:vv:comments_multidim_distributions_2013.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Некруткин В.В. Математические ожидания [http://statmod.ru/wiki/_media/books:vv:comments_expectation_2014.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Think Stats: Probability and Statistics for Programmers [http://greenteapress.com/thinkstats/thinkstats.pdf PDF]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Category:5 курс. Весна 2015]]&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0_2015&amp;diff=5485</id>
		<title>Статистика 2015</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0_2015&amp;diff=5485"/>
				<updated>2015-02-20T00:11:11Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Лекции - Антон Коробейников (&amp;lt;b&amp;gt;anton@korobeynikov.info&amp;lt;/b&amp;gt;)&lt;br /&gt;
&lt;br /&gt;
Практика - Александр Шлемов (&amp;lt;b&amp;gt;ShlemovAlex@gmail.com&amp;lt;/b&amp;gt;) &lt;br /&gt;
&lt;br /&gt;
= Предварительная программа =&lt;br /&gt;
== Фрагменты теории вероятностей ==&lt;br /&gt;
# Геометрическая вероятность. Пример (множество Витали). Непрерывная вероятность.&lt;br /&gt;
# Базовые вещи: пространство элементарных исходов, сигма-алгебра (для галочки), вероятность. &lt;br /&gt;
# Случайная величина. Распределение случайной величины. Плотность. Функция распределения. Свойства.&lt;br /&gt;
# Распределения случайных векторов. Плотность. Ф.р. &lt;br /&gt;
# Независимость случайных величин&lt;br /&gt;
# Преобразования с.в. - сумма, произведение. Смеси. Формула полной вероятности.&lt;br /&gt;
# Классические распределения&lt;br /&gt;
# Среднее, дисперсия, корреляция, медиана. Свойства. &lt;br /&gt;
# Сходимость распределений. Почти наверное, по вероятности, слабая (по распределению). Связь. Примеры.&lt;br /&gt;
# ЗБЧ, ЦПТ&lt;br /&gt;
&lt;br /&gt;
== Элементарная статистика ==&lt;br /&gt;
# Понятие выборки. Эмпирическое распределение&lt;br /&gt;
# Понятие характеристик. Эмпирические и генеральные характеристики&lt;br /&gt;
# Оценки. Свойства. Понятия несмещенности, состоятельности. Способы построения оценок: метод подстановки (моментов), метод максимум правдоподобия &lt;br /&gt;
# Доверительные интервалы. Понятие. Примеры: доверительные интервалы для среднего и дисперсии в нормальной модели, асимптотические доверительные интервалы исходя из ЦПТ&lt;br /&gt;
# Проверка гипотез&lt;br /&gt;
&lt;br /&gt;
== Домашние задания по практике ==&lt;br /&gt;
* К.р. по статистике [[Файл:work_stat.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Результаты и итоги ==&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Чернова Н. И. [http://www.nsu.ru/mmf/tvims/chernova/tv/index.html Теория вероятностей]: Учеб. пособие / Новосиб. гос. ун-т. Новосибирск, 2007. 160 с.&lt;br /&gt;
# Гнеденко Б. В. Курс теории вероятностей. 8-е изд., испр. и доп.—М.: Едиториал УРСС, 2005.— 448 с. &lt;br /&gt;
# Чернова Н. И. [http://www.nsu.ru/mmf/tvims/chernova/ms/index.html Математическая статистика]: Учеб. пособие / Новосиб. гос. ун-т. Новосибирск, 2007. 148 с.&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# Некруткин В.В. Распределения одномерных случайных величин. [http://statmod.ru/wiki/_media/books:vv:comments_one_dim_distributions_2013_1.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Некруткин В.В. Распределения случайных векторов [http://statmod.ru/wiki/_media/books:vv:comments_multidim_distributions_2013.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Некруткин В.В. Математические ожидания [http://statmod.ru/wiki/_media/books:vv:comments_expectation_2014.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Think Stats: Probability and Statistics for Programmers [http://greenteapress.com/thinkstats/thinkstats.pdf PDF]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Category:5 курс. Весна 2015]]&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0_2015&amp;diff=5484</id>
		<title>Статистика 2015</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0_2015&amp;diff=5484"/>
				<updated>2015-02-20T00:11:00Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Лекции - Антон Коробейников (&amp;lt;b&amp;gt;anton@korobeynikov.info&amp;lt;/b&amp;gt;)&lt;br /&gt;
&lt;br /&gt;
Практика - Александр Шлемов (&amp;lt;b&amp;gt;ShlemovAlex@gmail.com&amp;lt;/b&amp;gt;) &lt;br /&gt;
&lt;br /&gt;
= Предварительная программа =&lt;br /&gt;
== Ошметки теории вероятностей ==&lt;br /&gt;
# Геометрическая вероятность. Пример (множество Витали). Непрерывная вероятность.&lt;br /&gt;
# Базовые вещи: пространство элементарных исходов, сигма-алгебра (для галочки), вероятность. &lt;br /&gt;
# Случайная величина. Распределение случайной величины. Плотность. Функция распределения. Свойства.&lt;br /&gt;
# Распределения случайных векторов. Плотность. Ф.р. &lt;br /&gt;
# Независимость случайных величин&lt;br /&gt;
# Преобразования с.в. - сумма, произведение. Смеси. Формула полной вероятности.&lt;br /&gt;
# Классические распределения&lt;br /&gt;
# Среднее, дисперсия, корреляция, медиана. Свойства. &lt;br /&gt;
# Сходимость распределений. Почти наверное, по вероятности, слабая (по распределению). Связь. Примеры.&lt;br /&gt;
# ЗБЧ, ЦПТ&lt;br /&gt;
&lt;br /&gt;
== Элементарная статистика ==&lt;br /&gt;
# Понятие выборки. Эмпирическое распределение&lt;br /&gt;
# Понятие характеристик. Эмпирические и генеральные характеристики&lt;br /&gt;
# Оценки. Свойства. Понятия несмещенности, состоятельности. Способы построения оценок: метод подстановки (моментов), метод максимум правдоподобия &lt;br /&gt;
# Доверительные интервалы. Понятие. Примеры: доверительные интервалы для среднего и дисперсии в нормальной модели, асимптотические доверительные интервалы исходя из ЦПТ&lt;br /&gt;
# Проверка гипотез&lt;br /&gt;
&lt;br /&gt;
== Домашние задания по практике ==&lt;br /&gt;
* К.р. по статистике [[Файл:work_stat.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Результаты и итоги ==&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Чернова Н. И. [http://www.nsu.ru/mmf/tvims/chernova/tv/index.html Теория вероятностей]: Учеб. пособие / Новосиб. гос. ун-т. Новосибирск, 2007. 160 с.&lt;br /&gt;
# Гнеденко Б. В. Курс теории вероятностей. 8-е изд., испр. и доп.—М.: Едиториал УРСС, 2005.— 448 с. &lt;br /&gt;
# Чернова Н. И. [http://www.nsu.ru/mmf/tvims/chernova/ms/index.html Математическая статистика]: Учеб. пособие / Новосиб. гос. ун-т. Новосибирск, 2007. 148 с.&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# Некруткин В.В. Распределения одномерных случайных величин. [http://statmod.ru/wiki/_media/books:vv:comments_one_dim_distributions_2013_1.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Некруткин В.В. Распределения случайных векторов [http://statmod.ru/wiki/_media/books:vv:comments_multidim_distributions_2013.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Некруткин В.В. Математические ожидания [http://statmod.ru/wiki/_media/books:vv:comments_expectation_2014.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Think Stats: Probability and Statistics for Programmers [http://greenteapress.com/thinkstats/thinkstats.pdf PDF]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Category:5 курс. Весна 2015]]&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0_2015&amp;diff=5350</id>
		<title>Статистика 2015</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0_2015&amp;diff=5350"/>
				<updated>2015-02-13T09:19:48Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Предварительная программа =&lt;br /&gt;
== Фрагменты теории вероятностей ==&lt;br /&gt;
# Геометрическая вероятность. Пример (множество Витали). Непрерывная вероятность.&lt;br /&gt;
# Базовые вещи: пространство элементарных исходов, сигма-алгебра (для галочки), вероятность. &lt;br /&gt;
# Случайная величина. Распределение случайной величины. Плотность. Функция распределения. Свойства.&lt;br /&gt;
# Распределения случайных векторов. Плотность. Ф.р. &lt;br /&gt;
# Независимость случайных величин&lt;br /&gt;
# Преобразования с.в. - сумма, произведение. Смеси. Формула полной вероятности.&lt;br /&gt;
# Классические распределения&lt;br /&gt;
# Среднее, дисперсия, корреляция, медиана. Свойства. &lt;br /&gt;
# Сходимость распределений. Почти наверное, по вероятности, слабая (по распределению). Связь. Примеры.&lt;br /&gt;
# ЗБЧ, ЦПТ&lt;br /&gt;
&lt;br /&gt;
== Элементарная статистика ==&lt;br /&gt;
# Понятие выборки. Эмпирическое распределение&lt;br /&gt;
# Понятие характеристик. Эмпирические и генеральные характеристики&lt;br /&gt;
# Оценки. Свойства. Понятия несмещенности, состоятельности. Способы построения оценок: метод подстановки (моментов), метод максимум правдоподобия &lt;br /&gt;
# Доверительные интервалы. Понятие. Примеры: доверительные интервалы для среднего и дисперсии в нормальной модели, асимптотические доверительные интервалы исходя из ЦПТ&lt;br /&gt;
# Проверка гипотез&lt;br /&gt;
&lt;br /&gt;
== Домашние задания по практике ==&lt;br /&gt;
* К.р. по статистике [[Файл:work_stat.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Результаты и итоги ==&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Чернова Н. И. Теория вероятностей: Учеб. пособие / Новосиб. гос. ун-т. Новосибирск, 2007. 160 с.&lt;br /&gt;
# Гнеденко Б. В. Курс теории вероятностей. 8-е изд., испр. и доп.—М.: Едиториал УРСС, 2005.— 448 с. &lt;br /&gt;
# Чернова Н. И. Математическая статистика: Учеб. пособие / Новосиб. гос. ун-т. Новосибирск, 2007. 148 с.&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# Некруткин В.В. Распределения одномерных случайных величин. [http://statmod.ru/wiki/_media/books:vv:comments_one_dim_distributions_2013_1.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Некруткин В.В. Распределения случайных векторов [http://statmod.ru/wiki/_media/books:vv:comments_multidim_distributions_2013.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Некруткин В.В. Математические ожидания [http://statmod.ru/wiki/_media/books:vv:comments_expectation_2014.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Think Stats: Probability and Statistics for Programmers [http://greenteapress.com/thinkstats/thinkstats.pdf PDF]&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0_2014&amp;diff=5287</id>
		<title>Статистика 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0_2014&amp;diff=5287"/>
				<updated>2015-01-30T16:07:18Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Фрагменты теории вероятностей */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Предварительная программа =&lt;br /&gt;
== Фрагменты теории вероятностей ==&lt;br /&gt;
# Геометрическая вероятность. Пример (множество Витали). Непрерывная вероятность. ''(14.02.2014)''&lt;br /&gt;
# Базовые вещи: пространство элементарных исходов, сигма-алгебра (для галочки), вероятность.  ''(14.02.2014')'&lt;br /&gt;
# Случайная величина. Распределение случайной величины. Плотность. Функция распределения. Свойства. ''(14.02.2014, 21.02.2014)''&lt;br /&gt;
# Распределения случайных векторов. Плотность. Ф.р. ''(28.02.2014)''&lt;br /&gt;
# Независимость случайных величин  ''(28.02.2014)''&lt;br /&gt;
# Преобразования с.в. - сумма, произведение. Смеси. Формула полной вероятности.&lt;br /&gt;
# Классические распределения ''(21.02.2014)''&lt;br /&gt;
# Среднее, дисперсия, корреляция, медиана. Свойства. ''(7.03.2014)''&lt;br /&gt;
# Сходимость распределений. Почти наверное, по вероятности, слабая (по распределению). Связь. Примеры. ''(14.03.2014)''&lt;br /&gt;
# ЗБЧ, ЦПТ ''(14.03.2014)''&lt;br /&gt;
&lt;br /&gt;
== Элементарная статистика ==&lt;br /&gt;
# Понятие выборки. Эмпирическое распределение ''(21.03.2014)''&lt;br /&gt;
# Понятие характеристик. Эмпирические и генеральные характеристики ''(21.03.2014)''&lt;br /&gt;
# Оценки. Свойства. Понятия несмещенности, состоятельности. Способы построения оценок: метод подстановки (моментов), метод максимум правдоподобия ''(28.03.2014)''&lt;br /&gt;
# Доверительные интервалы. Понятие. Примеры: доверительные интервалы для среднего и дисперсии в нормальной модели, асимптотические доверительные интервалы исходя из ЦПТ ''(11.04.2014)''&lt;br /&gt;
# Проверка гипотез&lt;br /&gt;
&lt;br /&gt;
== Домашние задания по практике ==&lt;br /&gt;
* '''21 февраля''' Комбинаторика, независимость, геометрическая вероятность. [[Файл:task21feb.pdf]]&lt;br /&gt;
* '''28 февраля''' Независимость случайных величин, формула полной вероятности, формула Байеса. [[Файл:task28feb.pdf]]&lt;br /&gt;
* '''7 марта''' Неперывная формула Байеса, матожидание, дисперсия, коварация, корреляция (файл обновлен, исправлены опечатки). [[Файл:task7mar.pdf]]&lt;br /&gt;
* '''14 марта''' Сходимость, условные распределения, преобразования случайных величин (задание на дом и задачи для разбора на следующее занятие) [[Файл:task14mar.pdf]]&lt;br /&gt;
* '''21 марта''' Преобразования случайных величин, метод Монте-Карло, характеристики с.в. (обновил файл, опечатка в последнем интеграле)[[Файл:task21mar.pdf]]&lt;br /&gt;
* '''28 марта''' Оценки, свойства оценок [[Файл:task28mar.pdf]]&lt;br /&gt;
* '''4 апреля''' К/р. [[Файл:work1.pdf]], Относительная эффективность оценок, робастность, порядковые статистики и оценки, связанные с ними, пример многомерного Монте-Карло интегрирования (в этот раз с подробным разбором нескольких важных задач) [[Файл:task4apr.pdf]]&lt;br /&gt;
* '''11 апреля''' Доверительные интервалы [[Файл:task11apr.pdf]]&lt;br /&gt;
* '''18 апреля''' Доверительные интервалы II (параметрическое и непрараметрическое оценивание квантилей, М-К доверительные интервалы) [[Файл:task18apr.pdf]]&lt;br /&gt;
* Объявление и примеры задач для подготовки к К/Р. [[Файл:work_stat_examples.pdf]]&lt;br /&gt;
* Конспект по проверке гипотез [[Файл:hyptest.pdf]]&lt;br /&gt;
* К.р. по статистике [[Файл:work_stat.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Результаты и итоги ==&lt;br /&gt;
'''Цена задач:'''&lt;br /&gt;
* Задача контрольной --- 2 балла&lt;br /&gt;
* Задача по проге --- 1 балл&lt;br /&gt;
* Задача по ДЗ --- 0.5 балла&lt;br /&gt;
&lt;br /&gt;
'''На зачет необходимо 22 балла'''&lt;br /&gt;
&lt;br /&gt;
'''Все, у кого есть 22 и более баллов, получают зачет автоматически и более могут ни о чем не волноваться'''&lt;br /&gt;
&lt;br /&gt;
У тех, кому баллов не хватает, есть две опции:&lt;br /&gt;
# Прислать одну или несколько прогерских задач&lt;br /&gt;
# Переписать в следующую пятницу одну или обе контрольных работы (при этом можно переписывать только незачтенные задачи)&lt;br /&gt;
&lt;br /&gt;
[https://www.dropbox.com/s/ewzsx3f29gd72fn/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.xlsx Итоги (xlsx-формат)]&lt;br /&gt;
&lt;br /&gt;
[https://www.dropbox.com/s/1qdunrev99i0gqm/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods Итоги (ods-формат)]&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Чернова Н. И. Теория вероятностей: Учеб. пособие / Новосиб. гос. ун-т. Новосибирск, 2007. 160 с.&lt;br /&gt;
# Гнеденко Б. В. Курс теории вероятностей. 8-е изд., испр. и доп.—М.: Едиториал УРСС, 2005.— 448 с. &lt;br /&gt;
# Чернова Н. И. Математическая статистика: Учеб. пособие / Новосиб. гос. ун-т. Новосибирск, 2007. 148 с.&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# Некруткин В.В. Распределения одномерных случайных величин. [http://statmod.ru/wiki/_media/books:vv:comments_one_dim_distributions_2013_1.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Некруткин В.В. Распределения случайных векторов [http://statmod.ru/wiki/_media/books:vv:comments_multidim_distributions_2013.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Некруткин В.В. Математические ожидания [http://statmod.ru/wiki/_media/books:vv:comments_expectation_2014.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Think Stats: Probability and Statistics for Programmers [http://greenteapress.com/thinkstats/thinkstats.pdf PDF]&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0_2014&amp;diff=5286</id>
		<title>Статистика 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0_2014&amp;diff=5286"/>
				<updated>2015-01-30T16:06:46Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Предварительная программа =&lt;br /&gt;
== Фрагменты теории вероятностей ==&lt;br /&gt;
# Геометрическая вероятность. Множество Витали. Непрерывная вероятность. ''(14.02.2014)''&lt;br /&gt;
# Базовые вещи: пространство элементарных исходов, сигма-алгебра, вероятность.  ''(14.02.2014')'&lt;br /&gt;
# Случайная величина. Распределение случайной величины. Плотность. Функция распределения. Свойства. ''(14.02.2014, 21.02.2014)''&lt;br /&gt;
# Распределения случайных векторов. Плотность. Ф.р. ''(28.02.2014)''&lt;br /&gt;
# Независимость случайных величин  ''(28.02.2014)''&lt;br /&gt;
# Преобразования с.в. - сумма, произведение. Смеси. Формула полной вероятности.&lt;br /&gt;
# Классические распределения ''(21.02.2014)''&lt;br /&gt;
# Среднее, дисперсия, корреляция, медиана. Свойства. ''(7.03.2014)''&lt;br /&gt;
# Сходимость распределений. Почти наверное, по вероятности, слабая (по распределению). Связь. Примеры. ''(14.03.2014)''&lt;br /&gt;
# ЗБЧ, ЦПТ ''(14.03.2014)''&lt;br /&gt;
&lt;br /&gt;
== Элементарная статистика ==&lt;br /&gt;
# Понятие выборки. Эмпирическое распределение ''(21.03.2014)''&lt;br /&gt;
# Понятие характеристик. Эмпирические и генеральные характеристики ''(21.03.2014)''&lt;br /&gt;
# Оценки. Свойства. Понятия несмещенности, состоятельности. Способы построения оценок: метод подстановки (моментов), метод максимум правдоподобия ''(28.03.2014)''&lt;br /&gt;
# Доверительные интервалы. Понятие. Примеры: доверительные интервалы для среднего и дисперсии в нормальной модели, асимптотические доверительные интервалы исходя из ЦПТ ''(11.04.2014)''&lt;br /&gt;
# Проверка гипотез&lt;br /&gt;
&lt;br /&gt;
== Домашние задания по практике ==&lt;br /&gt;
* '''21 февраля''' Комбинаторика, независимость, геометрическая вероятность. [[Файл:task21feb.pdf]]&lt;br /&gt;
* '''28 февраля''' Независимость случайных величин, формула полной вероятности, формула Байеса. [[Файл:task28feb.pdf]]&lt;br /&gt;
* '''7 марта''' Неперывная формула Байеса, матожидание, дисперсия, коварация, корреляция (файл обновлен, исправлены опечатки). [[Файл:task7mar.pdf]]&lt;br /&gt;
* '''14 марта''' Сходимость, условные распределения, преобразования случайных величин (задание на дом и задачи для разбора на следующее занятие) [[Файл:task14mar.pdf]]&lt;br /&gt;
* '''21 марта''' Преобразования случайных величин, метод Монте-Карло, характеристики с.в. (обновил файл, опечатка в последнем интеграле)[[Файл:task21mar.pdf]]&lt;br /&gt;
* '''28 марта''' Оценки, свойства оценок [[Файл:task28mar.pdf]]&lt;br /&gt;
* '''4 апреля''' К/р. [[Файл:work1.pdf]], Относительная эффективность оценок, робастность, порядковые статистики и оценки, связанные с ними, пример многомерного Монте-Карло интегрирования (в этот раз с подробным разбором нескольких важных задач) [[Файл:task4apr.pdf]]&lt;br /&gt;
* '''11 апреля''' Доверительные интервалы [[Файл:task11apr.pdf]]&lt;br /&gt;
* '''18 апреля''' Доверительные интервалы II (параметрическое и непрараметрическое оценивание квантилей, М-К доверительные интервалы) [[Файл:task18apr.pdf]]&lt;br /&gt;
* Объявление и примеры задач для подготовки к К/Р. [[Файл:work_stat_examples.pdf]]&lt;br /&gt;
* Конспект по проверке гипотез [[Файл:hyptest.pdf]]&lt;br /&gt;
* К.р. по статистике [[Файл:work_stat.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Результаты и итоги ==&lt;br /&gt;
'''Цена задач:'''&lt;br /&gt;
* Задача контрольной --- 2 балла&lt;br /&gt;
* Задача по проге --- 1 балл&lt;br /&gt;
* Задача по ДЗ --- 0.5 балла&lt;br /&gt;
&lt;br /&gt;
'''На зачет необходимо 22 балла'''&lt;br /&gt;
&lt;br /&gt;
'''Все, у кого есть 22 и более баллов, получают зачет автоматически и более могут ни о чем не волноваться'''&lt;br /&gt;
&lt;br /&gt;
У тех, кому баллов не хватает, есть две опции:&lt;br /&gt;
# Прислать одну или несколько прогерских задач&lt;br /&gt;
# Переписать в следующую пятницу одну или обе контрольных работы (при этом можно переписывать только незачтенные задачи)&lt;br /&gt;
&lt;br /&gt;
[https://www.dropbox.com/s/ewzsx3f29gd72fn/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.xlsx Итоги (xlsx-формат)]&lt;br /&gt;
&lt;br /&gt;
[https://www.dropbox.com/s/1qdunrev99i0gqm/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods Итоги (ods-формат)]&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Чернова Н. И. Теория вероятностей: Учеб. пособие / Новосиб. гос. ун-т. Новосибирск, 2007. 160 с.&lt;br /&gt;
# Гнеденко Б. В. Курс теории вероятностей. 8-е изд., испр. и доп.—М.: Едиториал УРСС, 2005.— 448 с. &lt;br /&gt;
# Чернова Н. И. Математическая статистика: Учеб. пособие / Новосиб. гос. ун-т. Новосибирск, 2007. 148 с.&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# Некруткин В.В. Распределения одномерных случайных величин. [http://statmod.ru/wiki/_media/books:vv:comments_one_dim_distributions_2013_1.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Некруткин В.В. Распределения случайных векторов [http://statmod.ru/wiki/_media/books:vv:comments_multidim_distributions_2013.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Некруткин В.В. Математические ожидания [http://statmod.ru/wiki/_media/books:vv:comments_expectation_2014.pdf?id=books%3Avv&amp;amp;cache=cache PDF]&lt;br /&gt;
# Think Stats: Probability and Statistics for Programmers [http://greenteapress.com/thinkstats/thinkstats.pdf PDF]&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=5280</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=5280"/>
				<updated>2015-01-22T13:14:31Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп. ''(17.10)'' [[Файл:SL-05-CVBoot.pdf]]&lt;br /&gt;
# Feature extraction: Principal Component Analysis. ''(24.10)'' [[Файл:SL-06-PCA.pdf]]&lt;br /&gt;
# Кластеризация (k-means, иерархическая, model based clustering) ''(31.10)'' [[Файл:SL-07-Clustering.pdf]]&lt;br /&gt;
# Снова о подборе линейной модели. Best subset selection. Forward / backward selection. AIC, BIC, Adjusted RSS, Mallow's C_p. Регуляризация (ridge regression, LASSO). ''(21.11)'' [[Файл:SL-08-ModelSelection.pdf]] &lt;br /&gt;
# Support vector machines ''(28.11)'' [[Файл:SL-09-SVM.pdf]]&lt;br /&gt;
# Деревья. ''(05.12, 12.12)'' [[Файл:SL-10-Trees.pdf]]&lt;br /&gt;
# Нелинейности [[Файл:SL-11-Nonlinear.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
# Задание с 24 октября [[Файл:Task5.pdf]]&lt;br /&gt;
# Задание с 28 ноября [[Файл:Task6.pdf]], данные [[Файл:data28nov.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов *&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова *&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
----&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков *&lt;br /&gt;
* Аманов, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Атамась, Обедин, Лучихин, Афанасьев *&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков *&lt;br /&gt;
----&lt;br /&gt;
* Антон Иванов, Гончарова Ирина, Жирков Игорь *&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=5279</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=5279"/>
				<updated>2015-01-22T13:04:13Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп. ''(17.10)'' [[Файл:SL-05-CVBoot.pdf]]&lt;br /&gt;
# Feature extraction: Principal Component Analysis. ''(24.10)'' [[Файл:SL-06-PCA.pdf]]&lt;br /&gt;
# Кластеризация (k-means, иерархическая, model based clustering) ''(31.10)'' [[Файл:SL-07-Clustering.pdf]]&lt;br /&gt;
# Снова о подборе линейной модели. Best subset selection. Forward / backward selection. AIC, BIC, Adjusted RSS, Mallow's C_p. Регуляризация (ridge regression, LASSO). ''(21.11)'' [[Файл:SL-08-ModelSelection.pdf]] &lt;br /&gt;
# Support vector machines ''(28.11)'' [[Файл:SL-09-SVM.pdf]]&lt;br /&gt;
# Деревья. ''(05.12, 12.12)'' [[Файл:SL-10-Trees.pdf]]&lt;br /&gt;
# Нелинейности [[Файл:SL-11-Nonlinear.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
# Задание с 24 октября [[Файл:Task5.pdf]]&lt;br /&gt;
# Задание с 28 ноября [[Файл:Task6.pdf]], данные [[Файл:data28nov.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов *&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова *&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
----&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Атамась, Обедин, Лучихин, Афанасьев *&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков *&lt;br /&gt;
----&lt;br /&gt;
* Антон Иванов, Гончарова Ирина, Жирков Игорь *&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=5278</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=5278"/>
				<updated>2015-01-22T12:44:00Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп. ''(17.10)'' [[Файл:SL-05-CVBoot.pdf]]&lt;br /&gt;
# Feature extraction: Principal Component Analysis. ''(24.10)'' [[Файл:SL-06-PCA.pdf]]&lt;br /&gt;
# Кластеризация (k-means, иерархическая, model based clustering) ''(31.10)'' [[Файл:SL-07-Clustering.pdf]]&lt;br /&gt;
# Снова о подборе линейной модели. Best subset selection. Forward / backward selection. AIC, BIC, Adjusted RSS, Mallow's C_p. Регуляризация (ridge regression, LASSO). ''(21.11)'' [[Файл:SL-08-ModelSelection.pdf]] &lt;br /&gt;
# Support vector machines ''(28.11)'' [[Файл:SL-09-SVM.pdf]]&lt;br /&gt;
# Деревья. ''(05.12, 12.12)'' [[Файл:SL-10-Trees.pdf]]&lt;br /&gt;
# Нелинейности [[Файл:SL-11-Nonlinear.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
# Задание с 24 октября [[Файл:Task5.pdf]]&lt;br /&gt;
# Задание с 28 ноября [[Файл:Task6.pdf]], данные [[Файл:data28nov.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов *&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова *&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
----&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков *&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков *&lt;br /&gt;
* Атамась, Обедин, Лучихин, Афанасьев *&lt;br /&gt;
----&lt;br /&gt;
* Антон Иванов, Гончарова Ирина, Жирков Игорь *&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=5219</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=5219"/>
				<updated>2014-12-29T04:57:58Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп. ''(17.10)'' [[Файл:SL-05-CVBoot.pdf]]&lt;br /&gt;
# Feature extraction: Principal Component Analysis. ''(24.10)'' [[Файл:SL-06-PCA.pdf]]&lt;br /&gt;
# Кластеризация (k-means, иерархическая, model based clustering) ''(31.10)'' [[Файл:SL-07-Clustering.pdf]]&lt;br /&gt;
# Снова о подборе линейной модели. Best subset selection. Forward / backward selection. AIC, BIC, Adjusted RSS, Mallow's C_p. Регуляризация (ridge regression, LASSO). ''(21.11)'' [[Файл:SL-08-ModelSelection.pdf]] &lt;br /&gt;
# Support vector machines ''(28.11)'' [[Файл:SL-09-SVM.pdf]]&lt;br /&gt;
# Деревья. ''(05.12, 12.12)'' [[Файл:SL-10-Trees.pdf]]&lt;br /&gt;
# Нелинейности [[Файл:SL-11-Nonlinear.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
# Задание с 24 октября [[Файл:Task5.pdf]]&lt;br /&gt;
# Задание с 28 ноября [[Файл:Task6.pdf]], данные [[Файл:data28nov.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов *&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова *&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков *&lt;br /&gt;
* Антон Иванов, Гончарова Ирина, Жирков Игорь *&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков *&lt;br /&gt;
* Атамась, Обедин, Лучихин, Афанасьев *&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:SL-11-Nonlinear.pdf&amp;diff=5128</id>
		<title>Файл:SL-11-Nonlinear.pdf</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:SL-11-Nonlinear.pdf&amp;diff=5128"/>
				<updated>2014-12-12T14:45:32Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=5127</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=5127"/>
				<updated>2014-12-12T14:45:06Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Прочитанные лекции */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп. ''(17.10)'' [[Файл:SL-05-CVBoot.pdf]]&lt;br /&gt;
# Feature extraction: Principal Component Analysis. ''(24.10)'' [[Файл:SL-06-PCA.pdf]]&lt;br /&gt;
# Кластеризация (k-means, иерархическая, model based clustering) ''(31.10)'' [[Файл:SL-07-Clustering.pdf]]&lt;br /&gt;
# Снова о подборе линейной модели. Best subset selection. Forward / backward selection. AIC, BIC, Adjusted RSS, Mallow's C_p. Регуляризация (ridge regression, LASSO). ''(21.11)'' [[Файл:SL-08-ModelSelection.pdf]] &lt;br /&gt;
# Support vector machines ''(28.11)'' [[Файл:SL-09-SVM.pdf]]&lt;br /&gt;
# Деревья. ''(05.12, 12.12)'' [[Файл:SL-10-Trees.pdf]]&lt;br /&gt;
# Нелинейности [[Файл:SL-11-Nonlinear.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
# Задание с 24 октября [[Файл:Task5.pdf]]&lt;br /&gt;
# Задание с 28 октября [[Файл:Task6.pdf]], данные [[Файл:data28nov.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов *&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова *&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков *&lt;br /&gt;
* Антон Иванов, Гончарова Ирина, Жирков Игорь *&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков *&lt;br /&gt;
* Атамась, Обедин, Лучихин, Афанасьев *&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=5059</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=5059"/>
				<updated>2014-12-05T15:51:51Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп. ''(17.10)'' [[Файл:SL-05-CVBoot.pdf]]&lt;br /&gt;
# Feature extraction: Principal Component Analysis. ''(24.10)'' [[Файл:SL-06-PCA.pdf]]&lt;br /&gt;
# Кластеризация (k-means, иерархическая, model based clustering) ''(31.10)'' [[Файл:SL-07-Clustering.pdf]]&lt;br /&gt;
# Снова о подборе линейной модели. Best subset selection. Forward / backward selection. AIC, BIC, Adjusted RSS, Mallow's C_p. Регуляризация (ridge regression, LASSO). ''(21.11)'' [[Файл:SL-08-ModelSelection.pdf]] &lt;br /&gt;
# Support vector machines ''(28.11)'' [[Файл:SL-09-SVM.pdf]]&lt;br /&gt;
# Деревья.' '(05.12)'' [[Файл:SL-10-Trees.pdf]] &lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
# Задание с 24 октября [[Файл:Task5.pdf]]&lt;br /&gt;
# Задание с 28 октября [[Файл:Task6.pdf]], данные [[Файл:data28nov.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов *&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова *&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков *&lt;br /&gt;
* Антон Иванов, Гончарова Ирина, Жирков Игорь *&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков *&lt;br /&gt;
* Атамась, Обедин, Лучихин, Афанасьев *&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:SL-10-Trees.pdf&amp;diff=5058</id>
		<title>Файл:SL-10-Trees.pdf</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:SL-10-Trees.pdf&amp;diff=5058"/>
				<updated>2014-12-05T15:50:40Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=5049</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=5049"/>
				<updated>2014-12-04T21:55:31Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Прочитанные лекции */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп. ''(17.10)'' [[Файл:SL-05-CVBoot.pdf]]&lt;br /&gt;
# Feature extraction: Principal Component Analysis. ''(24.10)'' [[Файл:SL-06-PCA.pdf]]&lt;br /&gt;
# Кластеризация (k-means, иерархическая, model based clustering) ''(31.10)'' [[Файл:SL-07-Clustering.pdf]]&lt;br /&gt;
# Снова о подборе линейной модели. Best subset selection. Forward / backward selection. AIC, BIC, Adjusted RSS, Mallow's C_p. Регуляризация (ridge regression, LASSO). [[Файл:SL-08-ModelSelection.pdf]] ''(21.11)''&lt;br /&gt;
# Support vector machines [[Файл:SL-09-SVM.pdf]] ''(28.11)''&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
# Задание с 24 октября [[Файл:Task5.pdf]]&lt;br /&gt;
# Задание с 28 октября [[Файл:Task6.pdf]], данные [[Файл:data28nov.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов *&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова *&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков *&lt;br /&gt;
* Антон Иванов, Гончарова Ирина, Жирков Игорь *&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков *&lt;br /&gt;
* Атамась, Обедин, Лучихин, Афанасьев *&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=5048</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=5048"/>
				<updated>2014-12-04T21:54:13Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп. ''(17.10)'' [[Файл:SL-05-CVBoot.pdf]]&lt;br /&gt;
# Feature extraction: Principal Component Analysis. ''(24.10)'' [[Файл:SL-06-PCA.pdf]]&lt;br /&gt;
# Кластеризация (k-means, иерархическая, model based clustering) ''(31.11)'' [[Файл:SL-07-Clustering.pdf]]&lt;br /&gt;
# Снова о подборе линейной модели. Best subset selection. Forward / backward selection. AIC, BIC, Adjusted RSS, Mallow's C_p. Регуляризация (ridge regression, LASSO). [[Файл:SL-08-ModelSelection.pdf]]&lt;br /&gt;
# Support vector machines [[Файл:SL-09-SVM.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
# Задание с 24 октября [[Файл:Task5.pdf]]&lt;br /&gt;
# Задание с 28 октября [[Файл:Task6.pdf]], данные [[Файл:data28nov.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов *&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова *&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков *&lt;br /&gt;
* Антон Иванов, Гончарова Ирина, Жирков Игорь *&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков *&lt;br /&gt;
* Атамась, Обедин, Лучихин, Афанасьев *&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:SL-09-SVM.pdf&amp;diff=5047</id>
		<title>Файл:SL-09-SVM.pdf</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:SL-09-SVM.pdf&amp;diff=5047"/>
				<updated>2014-12-04T21:53:28Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4980</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4980"/>
				<updated>2014-11-28T20:55:03Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп. ''(17.10)'' [[Файл:SL-05-CVBoot.pdf]]&lt;br /&gt;
# Feature extraction: Principal Component Analysis. ''(24.10)'' [[Файл:SL-06-PCA.pdf]]&lt;br /&gt;
# Кластеризация (k-means, иерархическая, model based clustering) ''(31.11)'' [[Файл:SL-07-Clustering.pdf]]&lt;br /&gt;
# Снова о подборе линейной модели. Best subset selection. Forward / backward selection. AIC, BIC, Adjusted RSS, Mallow's C_p. Регуляризация (ridge regression, LASSO). [[Файл:SL-08-ModelSelection.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
# Задание с 24 октября [[Файл:Task5.pdf]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов *&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова *&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков *&lt;br /&gt;
* Антон Иванов, Гончарова Ирина, Жирков Игорь *&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков *&lt;br /&gt;
* Атамась, Обедин, Лучихин, Афанасьев *&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4920</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4920"/>
				<updated>2014-11-24T09:49:51Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп. ''(17.10)'' [[Файл:SL-05-CVBoot.pdf]]&lt;br /&gt;
# Feature extraction: Principal Component Analysis. ''(24.10)'' [[Файл:SL-06-PCA.pdf]]&lt;br /&gt;
# Кластеризация (k-means, иерархическая, model based clustering) ''(31.11)'' [[Файл:SL-07-Clustering.pdf]]&lt;br /&gt;
# Снова о подборе линейной модели. Best subset selection. Forward / backward selection. AIC, BIC, Adjusted RSS, Mallow's C_p. Регуляризация (ridge regression, LASSO). [[Файл:SL-08-ModelSelection.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
# Задание с 24 октября [[Файл:Task5.pdf]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов *&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова *&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков *&lt;br /&gt;
* Антон Иванов, Гончарова Ирина, Жирков Игорь *&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков *&lt;br /&gt;
* Атамась, Обедин, Лучихин *&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:SL-08-ModelSelection.pdf&amp;diff=4895</id>
		<title>Файл:SL-08-ModelSelection.pdf</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:SL-08-ModelSelection.pdf&amp;diff=4895"/>
				<updated>2014-11-21T13:36:12Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:08-ModelSelection.pdf&amp;diff=4894</id>
		<title>Файл:08-ModelSelection.pdf</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:08-ModelSelection.pdf&amp;diff=4894"/>
				<updated>2014-11-21T13:35:37Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4893</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4893"/>
				<updated>2014-11-21T13:35:16Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп. ''(17.10)'' [[Файл:SL-05-CVBoot.pdf]]&lt;br /&gt;
# Feature extraction: Principal Component Analysis. ''(24.10)'' [[Файл:SL-06-PCA.pdf]]&lt;br /&gt;
# Кластеризация (k-means, иерархическая, model based clustering) ''(31.11)'' [[Файл:SL-07-Clustering.pdf]]&lt;br /&gt;
# Снова о подборе линейной модели. Best subset selection. Forward / backward selection. AIC, BIC, Adjusted RSS, Mallow's C_p. Регуляризация (ridge regression, LASSO). [[Файл:SL-08-ModelSelection.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
# Задание с 24 октября [[Файл:Task5.pdf]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов *&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова *&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков *&lt;br /&gt;
* Антон Иванов, Гончарова Ирина, Жирков Игорь *&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков *&lt;br /&gt;
*&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4782</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4782"/>
				<updated>2014-11-08T08:18:43Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп. ''(17.10)'' [[Файл:SL-05-CVBoot.pdf]]&lt;br /&gt;
# Feature extraction: Principal Component Analysis. ''(24.10)'' [[Файл:SL-06-PCA.pdf]]&lt;br /&gt;
# Кластеризация (k-means, иерархическая, model based clustering) ''(31.11)'' [[Файл:SL-07-Clustering.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
# Задание с 24 октября [[Файл:Task5.pdf]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов *&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова *&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков *&lt;br /&gt;
* Антон Иванов, Гончарова Ирина, Жирков Игорь *&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков *&lt;br /&gt;
*&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4621</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4621"/>
				<updated>2014-11-04T21:04:45Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп. ''(17.10)'' [[Файл:SL-05-CVBoot.pdf]]&lt;br /&gt;
# Feature extraction: Principal Component Analysis. ''(24.10)'' [[Файл:SL-06-PCA.pdf]]&lt;br /&gt;
# Кластеризация (k-means, иерархическая, model based clustering) ''(31.11)'' [[Файл:SL-07-Clustering.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
# Задание с 24 октября [[Файл:Task5.pdf]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова *&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков *&lt;br /&gt;
* Антон Иванов, Гончарова Ирина, Жирков Игорь *&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков *&lt;br /&gt;
* Тураев М., Аманов, Афанасьев,&lt;br /&gt;
* Атамась, Обедин, Лучихин&lt;br /&gt;
  * --- тема проекта выбрана и согласована&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4620</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4620"/>
				<updated>2014-11-04T21:03:38Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп. ''(17.10)'' [[Файл:SL-05-CVBoot.pdf]]&lt;br /&gt;
# Feature extraction: Principal Component Analysis. ''(24.10)'' [[Файл:SL-06-PCA.pdf]]&lt;br /&gt;
# Кластеризация (k-means, иерархическая, model based clustering) ''(31.11)'' [[Файл:SL-07-Clustering.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
# Задание с 24 октября [[Файл:Task5.pdf]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова *&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков&lt;br /&gt;
* Антон Иванов, Гончарова Ирина, Жирков Игорь *&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков *&lt;br /&gt;
* Тураев М., Аманов, Афанасьев,&lt;br /&gt;
* Атамась, Обедин, Лучихин&lt;br /&gt;
  * --- тема проекта выбрана и согласована&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4461</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4461"/>
				<updated>2014-10-23T22:59:57Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп. ''(17.10)'' [[Файл:SL-05-CVBoot.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова.&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков&lt;br /&gt;
* Антон Иванов, Гончарова Ирина *&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков *&lt;br /&gt;
* Тураев М., Аманов, Афанасьев,&lt;br /&gt;
* Атамась, Обедин, Лучихин&lt;br /&gt;
  * --- тема проекта выбрана и согласована&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:SL-05-CVBoot.pdf&amp;diff=4460</id>
		<title>Файл:SL-05-CVBoot.pdf</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:SL-05-CVBoot.pdf&amp;diff=4460"/>
				<updated>2014-10-23T22:59:39Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4459</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4459"/>
				<updated>2014-10-23T22:58:16Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова.&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков&lt;br /&gt;
* Антон Иванов, Гончарова Ирина *&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков *&lt;br /&gt;
* Тураев М., Аманов, Афанасьев,&lt;br /&gt;
* Атамась, Обедин, Лучихин&lt;br /&gt;
  * --- тема проекта выбрана и согласована&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4458</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4458"/>
				<updated>2014-10-23T22:56:50Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова.&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков&lt;br /&gt;
* Антон Иванов, Гончарова Ирина&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков *&lt;br /&gt;
* Тураев М., Аманов, Афанасьев,&lt;br /&gt;
* Атамась, Обедин, Лучихин&lt;br /&gt;
  * --- тема проекта выбрана и согласована&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4457</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4457"/>
				<updated>2014-10-23T22:56:05Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
# Задание с 17 октября (обновил файл, добавил комментарий) [[Файл:Task4.pdf]], данные из демонстрации [[Файл:data17oct.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег *&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова.&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина *&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков&lt;br /&gt;
* Антон Иванов, Гончарова Ирина&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков&lt;br /&gt;
* Тураев М., Аманов, Афанасьев,&lt;br /&gt;
* Атамась, Обедин, Лучихин&lt;br /&gt;
  * --- тема проекта выбрана и согласована&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4377</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4377"/>
				<updated>2014-10-17T19:06:16Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова.&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков&lt;br /&gt;
* Антон Иванов, Гончарова Ирина&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков&lt;br /&gt;
* Тураев М., Аманов, Афанасьев,&lt;br /&gt;
* Атамась, Обедин, Лучихин&lt;br /&gt;
  * --- тема проекта выбрана и согласована&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4373</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4373"/>
				<updated>2014-10-17T12:10:44Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова.&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков&lt;br /&gt;
* Антон Иванов, Гончарова Ирина&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат *&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков&lt;br /&gt;
* Тураев М., Аманов, Афанасьев, Лучихин&lt;br /&gt;
* Атамась, Обедин, Бубнов&lt;br /&gt;
  * --- тема проекта выбрана и согласована&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4370</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4370"/>
				<updated>2014-10-17T09:48:27Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова.&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков&lt;br /&gt;
* Антон Иванов, Гончарова Ирина&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
* Коваленко, Ворончихин, Овчинников, Цветков&lt;br /&gt;
* Тураев М., Аманов, Афанасьев, Лучихин&lt;br /&gt;
* Атамась, Обедин, Бубнов&lt;br /&gt;
  * --- тема проекта выбрана и согласована&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4369</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4369"/>
				<updated>2014-10-17T09:46:01Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
Результаты проверки заочных домашних заданий: [https://www.dropbox.com/s/xt4s5qa5xrnpp92/%D0%98%D1%82%D0%BE%D0%B3%D0%B8.ods?dl=0 Dropbox]&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
# Задание с 10 октября [[Файл:Task3.pdf]], данные для задания [[Файл:data10oct.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова.&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков&lt;br /&gt;
* Антон Иванов, Гончарова Ирина&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
  * --- тема проекта выбрана и согласована&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4236</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4236"/>
				<updated>2014-10-10T12:19:39Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes. ''(10.10)'' [[Файл:SL-04-Classification.pdf]]&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова.&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков&lt;br /&gt;
* Антон Иванов, Гончарова Ирина&lt;br /&gt;
* Гайдай Игорь, Карташов Никита, Новокрещенов Константин, Хабибуллин Марат&lt;br /&gt;
  * --- тема проекта выбрана и согласована&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:SL-04-Classification.pdf&amp;diff=4235</id>
		<title>Файл:SL-04-Classification.pdf</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:SL-04-Classification.pdf&amp;diff=4235"/>
				<updated>2014-10-10T12:18:45Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4232</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4232"/>
				<updated>2014-10-10T09:52:06Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)''&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова.&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкова *&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков&lt;br /&gt;
* Антон Иванов, Гончарова Ирина&lt;br /&gt;
&lt;br /&gt;
  * --- тема проекта выбрана и согласована&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4226</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4226"/>
				<updated>2014-10-09T21:56:07Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)''&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова.&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкову&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев, Денис Жарков&lt;br /&gt;
* ...&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4221</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4221"/>
				<updated>2014-10-09T12:20:17Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)''&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова.&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкову&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина&lt;br /&gt;
* Андроник Ордиян, Аркадий Калакуцкий, Богдан Бугаев&lt;br /&gt;
* ...&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4198</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4198"/>
				<updated>2014-10-08T08:57:13Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)''&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова.&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкову&lt;br /&gt;
* Комаров Александр, Крыщенко Антон, Тураев Тимур, Устюжанина Екатерина&lt;br /&gt;
* ...&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4177</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4177"/>
				<updated>2014-10-07T13:05:11Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)''&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова.&lt;br /&gt;
* Павел Авдеев, Татьяна Малыгина, Анна Лиознова, Надия Ситдыкову&lt;br /&gt;
* ...&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4176</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4176"/>
				<updated>2014-10-07T11:04:25Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)''&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Конспект [[Файл:Rcourse.pdf]] (черновик). Будет обновляться. Внутри все листинги и результат выполнения + какие-то комментарии.&lt;br /&gt;
&lt;br /&gt;
# Сырая версия history от 5 и 19 сентября (выложил в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]. Домашнее задание [[Файл:task_19sep.pdf]]&lt;br /&gt;
# Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
# Задание с 3 октября [[Файл:Task2.pdf]], данные для задания [[Файл:data3oct.tar.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег&lt;br /&gt;
* Екатерина Старостина, Дмитрий Мелешко, Маргарита Аксешина, Елена Бушманова.&lt;br /&gt;
* ...&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4116</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4116"/>
				<updated>2014-10-03T15:03:46Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]  Домашнее задание [[Файл:task_19sep.pdf]] (j(обновил файл, добавил новое задание-вопрос с лекции)&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)''&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Сырая версия history от 5 и 19 сентября (скоро выложу в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]&lt;br /&gt;
Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* Бондарев Тимофей, Демидов Герман, Сидоров Святослав, Яснев Олег&lt;br /&gt;
* ...&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4110</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4110"/>
				<updated>2014-10-03T13:26:37Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]  Домашнее задание [[Файл:task_19sep.pdf]] (j(обновил файл, добавил новое задание-вопрос с лекции)&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)''&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Сырая версия history от 5 и 19 сентября (скоро выложу в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]&lt;br /&gt;
Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов&lt;br /&gt;
* ...&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4109</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4109"/>
				<updated>2014-10-03T13:26:26Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Группы по проектам */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]  Домашнее задание [[Файл:task_19sep.pdf]] (j(обновил файл, добавил новое задание-вопрос с лекции)&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)''&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Сырая версия history от 5 и 19 сентября (скоро выложу в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]&lt;br /&gt;
Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
* Герман Демидов.&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4108</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4108"/>
				<updated>2014-10-03T13:25:52Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]  Домашнее задание [[Файл:task_19sep.pdf]] (j(обновил файл, добавил новое задание-вопрос с лекции)&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. ''(03.10)''&lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Классификация. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Сырая версия history от 5 и 19 сентября (скоро выложу в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]&lt;br /&gt;
Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4104</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4104"/>
				<updated>2014-10-03T07:36:53Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: /* Дедлайны */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]  Домашнее задание [[Файл:task_19sep.pdf]] (j(обновил файл, добавил новое задание-вопрос с лекции)&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Сырая версия history от 5 и 19 сентября (скоро выложу в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]&lt;br /&gt;
Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
* 10 октября - деление на группы по проектам&lt;br /&gt;
* 24 октября - финализация темы проекта&lt;br /&gt;
* TBA - презентации проектов&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4103</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4103"/>
				<updated>2014-10-03T07:36:20Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]  Домашнее задание [[Файл:task_19sep.pdf]] (j(обновил файл, добавил новое задание-вопрос с лекции)&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Сырая версия history от 5 и 19 сентября (скоро выложу в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]&lt;br /&gt;
Листинг для несостоявшегося занятия 26 сентября (будем с ним работать + еще немного) [[Файл:hist26sep.R.gz]]&lt;br /&gt;
&lt;br /&gt;
= Дедлайны =&lt;br /&gt;
# 10 октября - деление на группы по проектам&lt;br /&gt;
# 24 октября - финализация темы проекта&lt;br /&gt;
&lt;br /&gt;
= Группы по проектам =&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4025</id>
		<title>StatisticalLearning 2014</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=StatisticalLearning_2014&amp;diff=4025"/>
				<updated>2014-09-29T16:50:45Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Программа =&lt;br /&gt;
&lt;br /&gt;
== Прочитанные лекции ==&lt;br /&gt;
# Введение. Что такое statistical learning. Примеры. ''(05.09)'' [[Файл:SL-01-SLIntro.pdf]]&lt;br /&gt;
# И снова линейная регрессия. Оценивание. Проверка гипотез относительно коэффициентов. Доверительные интервалы для коэффициентов.  ''(19.09)'' [[Файл:SL-02-Regression.pdf]]  Домашнее задание [[Файл:task_19sep.pdf]] (j(обновил файл, добавил новое задание-вопрос с лекции)&lt;br /&gt;
# Категориальные переменные в регрессии. Выбор информативных признаков (немного). ''(26.09)'' [[Файл:SL-03-Regression.pdf]] [[Файл:SL-Advertising.zip]] &lt;br /&gt;
&lt;br /&gt;
== Возможные темы будущих лекций ==&lt;br /&gt;
&lt;br /&gt;
# Регрессия. Выбросы, гетероскедастичность, high leverage points.&lt;br /&gt;
# Классификация. Линейные методы. Логистическая регрессия. Дискриминантный анализ. Понятие ROC-кривой, AUC. Naive Bayes.&lt;br /&gt;
# Resampling: Кросс-валидация. Бутстреп.&lt;br /&gt;
# Снова о подборе линейной модели. Регуляризация (ridge regression, LASSO, elastic net). Робастная регрессия.&lt;br /&gt;
# Нелинейности. Полиномиальная регрессия. Сплайны. Локальная регрессия. GAM.&lt;br /&gt;
# Деревья. Bagging. Boosting.&lt;br /&gt;
# Support vector machines&lt;br /&gt;
# Unsupervised learning: PCA, кластеризация (k-means, иерархическая), model based clustering.&lt;br /&gt;
&lt;br /&gt;
= Материалы с практик =&lt;br /&gt;
Сырая версия history от 5 и 19 сентября (скоро выложу в виде отформатированного конспекта) [[Файл:hist5sep.R.gz]] [[Файл:hist19sep.R.gz]]&lt;br /&gt;
&lt;br /&gt;
= Результаты и итоги =&lt;br /&gt;
&lt;br /&gt;
= Литература=&lt;br /&gt;
==  Основная ==&lt;br /&gt;
# Hadley Wickham: &amp;quot;Advanced R&amp;quot; [http://adv-r.had.co.nz/] - Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов&lt;br /&gt;
# Patrick Burns: &amp;quot;The R Inferno&amp;quot; [http://www.burns-stat.com/documents/books/the-r-inferno/] - &amp;quot;Ад R&amp;quot;, потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R&lt;br /&gt;
#  Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani: &amp;quot;An Introduction to Statistical Learning (with Applications in R)&amp;quot; [http://www-bcf.usc.edu/~gareth/ISL/] - ISL, введение в SL с примерами, основное пособие курса&lt;br /&gt;
# Trevor Hastie, Robert Tibshirani, Jerome Friedman: &amp;quot;The Elements of Statistical Learning&amp;quot;[http://statweb.stanford.edu/~tibs/ElemStatLearn/] - ESL, для тех, кому предыдущая книга покажется недостаточно подробной и глубокой. Больше теории и шире охват, но гораздо сложнее и нет примеров кода&lt;br /&gt;
&lt;br /&gt;
== Дополнительная ==&lt;br /&gt;
# [http://ggplot2.org/] - Сайт lattice&lt;br /&gt;
# Sarkar, Deepayan: &amp;quot;Lattice. Multivariate Data Visualization with R&amp;quot; [http://www.springer.com/978-0-387-75968-5] - Исчерпывающий обзор графической системы &amp;quot;lattice&amp;quot; с примерами использования&lt;br /&gt;
# [http://lattice.r-forge.r-project.org/] - Сайт ggplot2&lt;br /&gt;
# Winston Chang: &amp;quot;R Graphics Cookbook&amp;quot; [http://amzn.com/1449316956?tag=ggplot2-20] - Введение в ggplot и рецепты&lt;br /&gt;
# Hadley Wickham: &amp;quot;ggplot2: Elegant Graphics for Data Analysis&amp;quot; [http://amzn.com/0387981403?tag=ggplot2-20] - Книга от создателя ggplot, для тех, кто хочет разобраться с внутренним устройством пакета и проектировать собственные графики&lt;br /&gt;
#  Q. Ethan McCallum, Stephen Weston: &amp;quot;Parallel R. Data Analysis in the Distributed World &amp;quot; [http://shop.oreilly.com/product/0636920021421.do] - Книга содержит исчерпывающую информацию о параллельном программировании на R (включая кластеры и облака)&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	<entry>
		<id>http://mit.spbau.ru/sewiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:SL-Advertising.zip&amp;diff=4024</id>
		<title>Файл:SL-Advertising.zip</title>
		<link rel="alternate" type="text/html" href="http://mit.spbau.ru/sewiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:SL-Advertising.zip&amp;diff=4024"/>
				<updated>2014-09-29T16:50:29Z</updated>
		
		<summary type="html">&lt;p&gt;Korobeynikov: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;/div&gt;</summary>
		<author><name>Korobeynikov</name></author>	</entry>

	</feed>