Машинное обучение 2 осень 2017 — различия между версиями

Материал из SEWiki
Перейти к: навигация, поиск
(Презентации:)
(Презентации:)
Строка 36: Строка 36:
  
 
* [[Медиа:Ml-15-2.pdf|Лекция №4. Feature selection (последние слайдов 20).]]
 
* [[Медиа:Ml-15-2.pdf|Лекция №4. Feature selection (последние слайдов 20).]]
 +
 +
* [[Медиа:Ml-16.pdf|Лекция №5. Уменьшение размерности.]]
 +
** '''Задание:''' Из выданного датасета необходимо выделить 10 фичей на которых score будет ближе всего к оригинальному. <br> Score определяется через RMSE от целевого значения. <br> Формат файлов такой: во второй колонке целевой сигнал, начиная с пятой - фичи.
 +
**[[Медиа:Features.txt.gz| Данные для обучения.]]
 +
**[[Медиа:FeaturesTest.txt.gz| Данные для теста.]]

Версия 16:53, 9 октября 2017

Семинар

Преподаватель: Кураленок И. Е.

План лекций:

  1. Введение в область
  2. Анализ задачи
    1. Сэмплирование и размерность задачи
    2. Уменьшение размерности: feature selection
    3. Уменьшение размерности: feature extraction
    4. Embedded модели на линейном примере (LASSO, LARS, etc.)
  3. Практическая оценка методов машинного обучения
  4. Теоретическая оценка
  5. Основные принципы построения целевых функций
  6. Необычные факторы в обучении
    1. Обучение на последовательностях
    2. Рекомендательные системы
  7. Построение целевых функций
  8. Введение в online обучение
  9. Несколько подходов к построению решающей функции
    1. Сэмплирование пространства решений и NFLT
    2. Введение в байесовское моделирование
    3. Сегментация пространства задачи (деревья, кластеризация,  :))
    4. Ансамбли (BOC->Boosting)
  10. История решения одной практической задачи (MLR)

Презентации:

  • Лекция №3. Уменьшение размерности.
    • Задание: определить истинную размерность пространства документов, если рассматривать их в модели "bag of words".
      Можно не ограничиваться только теми методами, что были рассказаны.
    • Кусок википедии: документы, для которых нужно определить истинную размерность пространства.