CompVis14
Преподаватель: Александр Вахитов (alex@divisionlabs.com)
Содержание
Лекции
Введение (часть об отчетности не смотреть) Файл:Intro.pdf
Линейные фильтры Файл:Linfilters.pdf
Фурье и дискретизация Файл:Fourier sampling.pdf
Детекция особенностей Файл:Feature detection.pdf
Геометрия [1]
Машинное обучение Файл:Ml.pdf
Основной источник - R. Szeliski, Computer Vision Algorithms and Applications (google it)
Вопросы
Необходимо знать все понятия, внесенные в список
1. Линейные фильтры (Гаусс, градиент, Собель, Лаплас)
2. Нелинейные фильтры (медиана, морфология-dilate, erode)
3. Преобразование Фурье и фильтрация фурье-коэффициентов
4. Детекторы особенных точек (Харрис, difference of gaussians)
5. Дескрипторы точек (sift)
6. Отслеживание точек (Лукас-Канаде)
7. Модель камеры (ортографическая, перспективная), дисторсия
8. Оценивание ракурса (2д-3д), гомография
9. Восстановление по паре кадров ракурса и позиций точек
10. Введение в машинное обучение (все элементы диаграммы, ROC, HOG-svm, Haar-каскад)
Список сдачи заданий: https://docs.google.com/spreadsheets/d/1IdKvlrhFumJoDaI5oNp6s-HaPwWtMAJe4DJ7N18Wyws/edit?usp=sharing
Домашнее задание 1
Необходимо определить местонахождение текста на изображении, то есть построить изображение, в котором пиксель равен 255, если этот пиксель занят текстом, и 0 - если не занят. Детектировать текст необходимо с помощью оператора Лапласа, предварительно смазав изображение оператором Гаусса. Параметры операторов подобрать наилучшим подходящим для задачи образом. Выполнять задание на Python с использованием OpenCV (http://docs.opencv.org/trunk/doc/py_tutorials/py_setup/py_setup_in_windows/py_setup_in_windows.html#install-opencv-python-in-windows).
- Картинка с текстом: Media:Text.bmp.zip
Домашнее задание 2
По бинарному изображению, являющемуся результатом задания 1, с помощью морфологических операций dilate, erode получить бинарные компонеты связности, соответствующие отдельным словам текста. Отрисовать объемлющие прямоугольники для каждой полученной бинарной компоненты связности.
Домашнее задание 3
Выполнить фильтр высоких частот (т.е. выделить высокие частоты, удалить низкие) с изображения (http://se.math.spbu.ru/SE/Members/avakhitov/mandril.bmp). Для этого выполнить преобразование Фурье изображения, обнулить необходимые его элементы и выполнить обратное преобразование. Применить к тому же самому изображению оператор Лапласа. Срок: 20.12.14 Срок: 20.12.14
Домашнее задание 4
Изображение из задания 3. Сдетектировать особенные точки методом SIFT, затем повернуть изображение на 45 градусов, уменьшить в 2 раза, снова сдетектировать точки и выполнить сопоставление (matching) с использованием flann. Посчитать процент точек первого изображения, верно сопоставленных. Для этого вычислить правильные сопоставления по известным трансформациям картинки. Срок: 20.12.14
Домашнее задание 5
На видео (Ettlinger Tor, http://i21www.ira.uka.de/image_sequences/) сдетектировать точки детектором Харриса и отследить пирамидальным методом Лукаса-Канаде, используя OpenCV реализации этих методов. Сдетектировать точки детектором FaST и также отследить Лукасом-Канаде. Срок: 20.12.14
Домашнее задание 6
Бонус на зачете
Необходимо по коллекции рукописных цифр NIST сделать бинарный классификатор 0 vs 1 на базе HOG-SVM с использованием OpenCV. Обучить на 50 изображениях из каждого класса, затем на полной тренировочной выборке, проверить каждый вариант на тестовой выборке. Сравнить результаты и быть готовым проанализировать с точки зрения переобучения (overfitting).