Машинное обучение 2015 — различия между версиями
Ekaterina (обсуждение | вклад) м (→Домашние задания.) |
(→Дополнительные источники по машинному обучению: книжка Ульмана с описанием LSH) |
||
Строка 68: | Строка 68: | ||
* К.В. Воронцов: [http://shad.yandex.ru/lectures/machine_learning.xml видеолекции 2014], [http://www.machinelearning.ru/wiki/index.php?title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%28%D0%BA%D1%83%D1%80%D1%81_%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9%2C_%D0%9A.%D0%92.%D0%92%D0%BE%D1%80%D0%BE%D0%BD%D1%86%D0%BE%D0%B2%29 материалы] (в т.ч. [http://www.machinelearning.ru/wiki/images/6/6d/Voron-ML-1.pdf пособие]) | * К.В. Воронцов: [http://shad.yandex.ru/lectures/machine_learning.xml видеолекции 2014], [http://www.machinelearning.ru/wiki/index.php?title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%28%D0%BA%D1%83%D1%80%D1%81_%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9%2C_%D0%9A.%D0%92.%D0%92%D0%BE%D1%80%D0%BE%D0%BD%D1%86%D0%BE%D0%B2%29 материалы] (в т.ч. [http://www.machinelearning.ru/wiki/images/6/6d/Voron-ML-1.pdf пособие]) | ||
* Andrew Ng http://ml-class.org/ | * Andrew Ng http://ml-class.org/ | ||
+ | |||
+ | === Дополнительные заметки === | ||
+ | * [http://infolab.stanford.edu/~ullman/mmds/book.pdf Mining of Massive Datasets (Ullman, Leskovec, Rajaraman)] (в частности, разделы 3.4—3.8 про Locality-Sensitive Hashing, еще в книге много других интересных структур данных для больших объемов данных, в т.ч. MapReduce, PageRank) | ||
== Дополнительные источники по Python == | == Дополнительные источники по Python == |
Версия 18:57, 31 марта 2015
Лекции — Екатерина Алексеевна Тузова (kt@jetbrains.com)
Содержание
Лекции
11 февраля, "Введение"
18 февраля, "Метрические методы классификации"
27 февраля, "Иерархическая кластеризация"
6 марта, "Кластеризация. Графовые и статистические алгоритмы"
13 марта, "Линейные классификаторы"
20 марта, "Метод опорных векторов"
27 марта, "Python и Numpy"
Домашние задания.
Адрес, на который надо присылать решения -- machine.teaching@gmail.com.
В теме письма должно быть написано "Домашняя работа N Иванов", где вместо Иванов надо поставить свою фамилию, а вместо N -- номер домашней работы.
1. Метод наименьших квадратов.
Дедлайн (20 баллов): 18.02.15 23:59
Дедлайн (10 баллов): 25.02.15 23:59
Условие в файле readme по ссылке — Домашнее задание 1
2. Соседи и вино.
Дедлайн (20 баллов): 25.02.15 23:59
Дедлайн (10 баллов): 03.03.15 23:59
Условие — Домашнее задание 2
3. Рибосома и иерархическая кластеризация
Дедлайн (20 баллов): 05.03.15 23:59
Дедлайн (10 баллов): 12.03.15 23:59
Условие — Домашнее задание 3
4. Comic-Con и k-means
Дедлайн (20 баллов): 13.03.15 23:59
Дедлайн (10 баллов): 20.03.15 23:59
Условие — Домашнее задание 4
5. Индейцы пима, диабет и линейный классификатор
Дедлайн (20 баллов): 26.03.15 23:59
Дедлайн (10 баллов): 02.04.15 23:59
Условие — Домашнее задание 5
6. Ядра SVM
Дедлайн (20 баллов): 02.04.15 23:59
Дедлайн (10 баллов): 09.04.15 23:59
Условие — Домашнее задание 6
Летучки в начале лекции.
18 февраля
27 февраля
6 марта
13 марта
20 марта
27 марта
Результаты
Дополнительные источники по машинному обучению
- G. James, D. Witten, T. Hastie, R. Tibshirani: "An Introduction to Statistical Learning"
- Christopher M. Bishop "Pattern Recognition and Machine Learning"
- Kevin P. Murphy "Machine Learning: A Probabilistic Perspective"
- К.В. Воронцов: видеолекции 2014, материалы (в т.ч. пособие)
- Andrew Ng http://ml-class.org/
Дополнительные заметки
- Mining of Massive Datasets (Ullman, Leskovec, Rajaraman) (в частности, разделы 3.4—3.8 про Locality-Sensitive Hashing, еще в книге много других интересных структур данных для больших объемов данных, в т.ч. MapReduce, PageRank)