CompVis14 — различия между версиями

Материал из SEWiki
Перейти к: навигация, поиск
Строка 14: Строка 14:
  
 
Машинное обучение [[Файл:ml.pdf]]
 
Машинное обучение [[Файл:ml.pdf]]
 +
 +
Основной источник - R. Szeliski, Computer Vision Algorithms and Applications (google it)
 +
 +
== Вопросы ==
 +
 +
Необходимо знать все понятия, внесенные в список
 +
 +
1. Линейные фильтры (Гаусс, градиент, Собель, Лаплас)
 +
 +
2. Нелинейные фильтры (медиана, морфология-dilate, erode)
 +
 +
3. Преобразование Фурье и фильтрация фурье-коэффициентов
 +
 +
4. Детекторы особенных точек (Харрис, difference of gaussians)
 +
 +
5. Дескрипторы точек (sift)
 +
 +
6. Отслеживание точек (Лукас-Канаде)
 +
 +
7. Модель камеры (ортографическая, перспективная), дисторсия
 +
 +
8. Оценивание ракурса (2д-3д), гомография
 +
 +
9. Восстановление по паре кадров ракурса и позиций точек
 +
 +
10. Введение в машинное обучение (все элементы диаграммы, ROC, HOG-svm, Haar-каскад)
 +
 
== Домашнее задание 1 ==
 
== Домашнее задание 1 ==
  

Версия 22:26, 16 декабря 2014

Преподаватель: Александр Вахитов (alex@divisionlabs.com)

Лекции

Введение (часть об отчетности не смотреть) Файл:Intro.pdf

Линейные фильтры Файл:Linfilters.pdf

Фурье и дискретизация Файл:Fourier sampling.pdf

Детекция особенностей Файл:Feature detection.pdf

Геометрия [1]

Машинное обучение Файл:Ml.pdf

Основной источник - R. Szeliski, Computer Vision Algorithms and Applications (google it)

Вопросы

Необходимо знать все понятия, внесенные в список

1. Линейные фильтры (Гаусс, градиент, Собель, Лаплас)

2. Нелинейные фильтры (медиана, морфология-dilate, erode)

3. Преобразование Фурье и фильтрация фурье-коэффициентов

4. Детекторы особенных точек (Харрис, difference of gaussians)

5. Дескрипторы точек (sift)

6. Отслеживание точек (Лукас-Канаде)

7. Модель камеры (ортографическая, перспективная), дисторсия

8. Оценивание ракурса (2д-3д), гомография

9. Восстановление по паре кадров ракурса и позиций точек

10. Введение в машинное обучение (все элементы диаграммы, ROC, HOG-svm, Haar-каскад)

Домашнее задание 1

Необходимо определить местонахождение текста на изображении, то есть построить изображение, в котором пиксель равен 255, если этот пиксель занят текстом, и 0 - если не занят. Детектировать текст необходимо с помощью оператора Лапласа, предварительно смазав изображение оператором Гаусса. Параметры операторов подобрать наилучшим подходящим для задачи образом. Выполнять задание на Python с использованием OpenCV (http://docs.opencv.org/trunk/doc/py_tutorials/py_setup/py_setup_in_windows/py_setup_in_windows.html#install-opencv-python-in-windows).

Домашнее задание 2

По бинарному изображению, являющемуся результатом задания 1, с помощью морфологических операций dilate, erode получить бинарные компонеты связности, соответствующие отдельным словам текста. Отрисовать объемлющие прямоугольники для каждой полученной бинарной компоненты связности.

Домашнее задание 3

Выполнить фильтр высоких частот (т.е. выделить высокие частоты, удалить низкие) с изображения (http://se.math.spbu.ru/SE/Members/avakhitov/mandril.bmp). Для этого выполнить преобразование Фурье изображения, обнулить необходимые его элементы и выполнить обратное преобразование. Применить к тому же самому изображению оператор Лапласа. Срок: 20.12.14 Срок: 20.12.14

Домашнее задание 4

Изображение из задания 3. Сдетектировать особенные точки методом SIFT, затем повернуть изображение на 45 градусов, уменьшить в 2 раза, снова сдетектировать точки и выполнить сопоставление (matching) с использованием flann. Посчитать процент точек первого изображения, верно сопоставленных. Для этого вычислить правильные сопоставления по известным трансформациям картинки. Срок: 20.12.14

Домашнее задание 5

На видео (Ettlinger Tor, http://i21www.ira.uka.de/image_sequences/) сдетектировать точки детектором Харриса и отследить пирамидальным методом Лукаса-Канаде, используя OpenCV реализации этих методов. Сдетектировать точки детектором FaST и также отследить Лукасом-Канаде. Срок: 20.12.14

Домашнее задание 6

Бонус на зачете

Необходимо по коллекции рукописных цифр NIST сделать бинарный классификатор 0 vs 1 на базе HOG-SVM с использованием OpenCV. Обучить на 50 изображениях из каждого класса, затем на полной тренировочной выборке, проверить каждый вариант на тестовой выборке. Сравнить результаты и быть готовым проанализировать с точки зрения переобучения (overfitting).