CompVis14 — различия между версиями
м |
|||
(не показаны 3 промежуточные версии 1 участника) | |||
Строка 14: | Строка 14: | ||
Машинное обучение [[Файл:ml.pdf]] | Машинное обучение [[Файл:ml.pdf]] | ||
+ | |||
+ | Основной источник - R. Szeliski, Computer Vision Algorithms and Applications (google it) | ||
+ | |||
+ | == Вопросы == | ||
+ | |||
+ | Необходимо знать все понятия, внесенные в список | ||
+ | |||
+ | 1. Линейные фильтры (Гаусс, градиент, Собель, Лаплас) | ||
+ | |||
+ | 2. Нелинейные фильтры (медиана, морфология-dilate, erode) | ||
+ | |||
+ | 3. Преобразование Фурье и фильтрация фурье-коэффициентов | ||
+ | |||
+ | 4. Детекторы особенных точек (Харрис, difference of gaussians) | ||
+ | |||
+ | 5. Дескрипторы точек (sift) | ||
+ | |||
+ | 6. Отслеживание точек (Лукас-Канаде) | ||
+ | |||
+ | 7. Модель камеры (ортографическая, перспективная), дисторсия | ||
+ | |||
+ | 8. Оценивание ракурса (2д-3д), гомография | ||
+ | |||
+ | 9. Восстановление по паре кадров ракурса и позиций точек | ||
+ | |||
+ | 10. Введение в машинное обучение (все элементы диаграммы, ROC, HOG-svm, Haar-каскад) | ||
+ | |||
+ | Список сдачи заданий: | ||
+ | https://docs.google.com/spreadsheets/d/1IdKvlrhFumJoDaI5oNp6s-HaPwWtMAJe4DJ7N18Wyws/edit?usp=sharing | ||
+ | |||
== Домашнее задание 1 == | == Домашнее задание 1 == | ||
Строка 34: | Строка 64: | ||
На видео (Ettlinger Tor, http://i21www.ira.uka.de/image_sequences/) сдетектировать точки детектором Харриса и отследить пирамидальным методом Лукаса-Канаде, используя OpenCV реализации этих методов. Сдетектировать точки детектором FaST и также отследить Лукасом-Канаде. | На видео (Ettlinger Tor, http://i21www.ira.uka.de/image_sequences/) сдетектировать точки детектором Харриса и отследить пирамидальным методом Лукаса-Канаде, используя OpenCV реализации этих методов. Сдетектировать точки детектором FaST и также отследить Лукасом-Канаде. | ||
Срок: 20.12.14 | Срок: 20.12.14 | ||
+ | |||
+ | == Домашнее задание 6 == | ||
+ | Бонус на зачете | ||
+ | |||
+ | Необходимо по коллекции рукописных цифр NIST сделать бинарный классификатор 0 vs 1 на базе HOG-SVM с использованием OpenCV. Обучить на 50 изображениях из каждого класса, затем на полной тренировочной выборке, проверить каждый вариант на тестовой выборке. Сравнить результаты и быть готовым проанализировать с точки зрения переобучения (overfitting). | ||
+ | |||
+ | |||
+ | [[Category:6 курс. Осень 2014]] |
Текущая версия на 12:49, 15 февраля 2015
Преподаватель: Александр Вахитов (alex@divisionlabs.com)
Содержание
Лекции
Введение (часть об отчетности не смотреть) Файл:Intro.pdf
Линейные фильтры Файл:Linfilters.pdf
Фурье и дискретизация Файл:Fourier sampling.pdf
Детекция особенностей Файл:Feature detection.pdf
Геометрия [1]
Машинное обучение Файл:Ml.pdf
Основной источник - R. Szeliski, Computer Vision Algorithms and Applications (google it)
Вопросы
Необходимо знать все понятия, внесенные в список
1. Линейные фильтры (Гаусс, градиент, Собель, Лаплас)
2. Нелинейные фильтры (медиана, морфология-dilate, erode)
3. Преобразование Фурье и фильтрация фурье-коэффициентов
4. Детекторы особенных точек (Харрис, difference of gaussians)
5. Дескрипторы точек (sift)
6. Отслеживание точек (Лукас-Канаде)
7. Модель камеры (ортографическая, перспективная), дисторсия
8. Оценивание ракурса (2д-3д), гомография
9. Восстановление по паре кадров ракурса и позиций точек
10. Введение в машинное обучение (все элементы диаграммы, ROC, HOG-svm, Haar-каскад)
Список сдачи заданий: https://docs.google.com/spreadsheets/d/1IdKvlrhFumJoDaI5oNp6s-HaPwWtMAJe4DJ7N18Wyws/edit?usp=sharing
Домашнее задание 1
Необходимо определить местонахождение текста на изображении, то есть построить изображение, в котором пиксель равен 255, если этот пиксель занят текстом, и 0 - если не занят. Детектировать текст необходимо с помощью оператора Лапласа, предварительно смазав изображение оператором Гаусса. Параметры операторов подобрать наилучшим подходящим для задачи образом. Выполнять задание на Python с использованием OpenCV (http://docs.opencv.org/trunk/doc/py_tutorials/py_setup/py_setup_in_windows/py_setup_in_windows.html#install-opencv-python-in-windows).
- Картинка с текстом: Media:Text.bmp.zip
Домашнее задание 2
По бинарному изображению, являющемуся результатом задания 1, с помощью морфологических операций dilate, erode получить бинарные компонеты связности, соответствующие отдельным словам текста. Отрисовать объемлющие прямоугольники для каждой полученной бинарной компоненты связности.
Домашнее задание 3
Выполнить фильтр высоких частот (т.е. выделить высокие частоты, удалить низкие) с изображения (http://se.math.spbu.ru/SE/Members/avakhitov/mandril.bmp). Для этого выполнить преобразование Фурье изображения, обнулить необходимые его элементы и выполнить обратное преобразование. Применить к тому же самому изображению оператор Лапласа. Срок: 20.12.14 Срок: 20.12.14
Домашнее задание 4
Изображение из задания 3. Сдетектировать особенные точки методом SIFT, затем повернуть изображение на 45 градусов, уменьшить в 2 раза, снова сдетектировать точки и выполнить сопоставление (matching) с использованием flann. Посчитать процент точек первого изображения, верно сопоставленных. Для этого вычислить правильные сопоставления по известным трансформациям картинки. Срок: 20.12.14
Домашнее задание 5
На видео (Ettlinger Tor, http://i21www.ira.uka.de/image_sequences/) сдетектировать точки детектором Харриса и отследить пирамидальным методом Лукаса-Канаде, используя OpenCV реализации этих методов. Сдетектировать точки детектором FaST и также отследить Лукасом-Канаде. Срок: 20.12.14
Домашнее задание 6
Бонус на зачете
Необходимо по коллекции рукописных цифр NIST сделать бинарный классификатор 0 vs 1 на базе HOG-SVM с использованием OpenCV. Обучить на 50 изображениях из каждого класса, затем на полной тренировочной выборке, проверить каждый вариант на тестовой выборке. Сравнить результаты и быть готовым проанализировать с точки зрения переобучения (overfitting).