Внимание: для доступа к курсам ITtensive на Udemy напишите, пожалуйста, на support@ittensive.com с названием курса или группы курсов, которые хотите пройти.
Второй курс из серии Машинное зрение посвящен локализации объекта на изображениях с помощью OpenCV на Python. Для работа по курсу необходимо установить модули numpy pandas sklearn keras tensorflow pillow opencv-python opencv-contrib-python scikit-image cmake face_recognition mrcnn.
Курс состоит из 4 больших частей:
Выделение форм
Разберем базовые подходы к фильтрации изображений и освоим авто-поворот изображений:
Графические фильтры: четкость, размытие, наращивание и эрозия.
Восстановление резкости: адаптивные гистограммы, Ричардсон-Люси, маска нечеткости и устранение шума.
Выделение границ по Собелю, Щару и Канни.
Сбор контуров из границ, ограничивающие прямоугольники и поворот изображения.
Преобразования Хафа и выделение окружностей.
В заключении соберем простой сканер штрих-кодов на изображении.
Выделение объектов
Применим общие подходы к обнаружению различных форм на изображении на примере человеческих лиц.
Примитивы Хаара и каскады Виолы-Джонса.
Гистограммы направленных градиентов.
Глубокие нейросети.
Локальные бинарные шаблоны гистограмм.
Для закрепления материала обнаружим лица на фотографиях и распознаем их.
Выделение признаков
Используем дескрипторы ключевых точек для масштабно-инвариантных преобразований.
SIFT и SURF.
ORB, FAST и BRIEF.
Моменты изображения.
Трехмерная трансформация и повороты.
Объединение изображений в панораму.
Объединим несколько изображений в панораму, используя ключевые точки.
Сегментация изображений
В заключении разберем нейросетевые подходы для локализации классов объектов на изображении.
YOLO: You Only Look Once.
Mask R-CNN: Regions CNN.
MobileNet-SSD: Single Shot Detection.
Сегментационные нейросети.
В качестве курсового проекта обработаем набор реальных фотографий для подготовки их к задаче распознавания или классификации.
56
20
TAKE THIS COURSE