Парадигма развития науки А. Е. Кононюк Основы фундаментальной теории искусственного интеллекта Книга 3 Зрительное восприятие изображений искусственным интеллектом Часть 2 Киев «Освіта України» 2017 А.Е. Кононюк Теория искусственного интеллекта Кононюк Анатолий Ефимович 2 А.Е. Кононюк Теория искусственного интеллекта 3 А.Е. Кононюк Теория искусственного интеллекта УДК 51 (075.8) ББК В161.я7 К65 Рецензент: Н.К.Печурин - д-р техн. наук, проф. (Национальный авиационный университет). Кононюк А. Е. К213 Основы фундаментальной теория искусственного интеллекта. — В 20-и кн. Кн.3, ч.2. — К.:Освіта України. 2017.—545 с. ISBN 978-966-373-693-8 (многотомное издание) ISBN 978-966-373-694-8 (книга 3, ч.2) Многотомная работа посвящена систематическому изложению общих формализмов, математических моделей и алгоритмических методов, которые могут быть исспользуемых при моделировании и исследованиях математических моделей объектов искусственного интеллекта. Развиваются представления и методы решения, основанные на теориях эвристического поиска и автоматическом доказательстве теорем, а также процедуральные методы, базирующиеся на классе проблемно-ориентированных языков, сочетающих свойства языков программирования и автоматических решателей задач отображения искусственного интеллекта различными математическими средствами. В работе излагаются основы теории отображения искусственного интеллекта такими математическими средствами как: множества, отношения, поверхности, пространства, алгебраические системы, матрицы, графы, математическая логика и др. Для бакалавров, специалистов, магистров, аспирантов, докторантов всех специальностей. УДК 51 (075.8) ББК В161.я7 ISBN 978-966-373-693-8 (многотомное издание) © Кононюк А. Е., 2017 ISBN 978-966-373-694-8 (книга 3,ч. 2) © Освіта України, 2017 4 А.Е. Кононюк Теория искусственного интеллекта Оглавление 1. Представление изображений в цифровой форме……………………10 1.1 Дискретизация изображений…………………………………….10 1.2 Квантование изображений……………………………………….27 1.2.1 Оптимальное квантование……………………………………….38 1.2.2 Квантование сигнала при наличии шумов……………………...41 1.3. Погрешности дискретного представления изображений……..44 1.3.1 Погрешность дискретизации…………………………………..44 1.3.2 Погрешность квантования……………………………………...46 1.4 Методы интерполяции изображений……………………………47 2. Улучшение изображений……………………………………………...51 2.1. Изменение контраста………………………………………………..52 2.2. Видоизменение гистограмм ………………………………………..63 2.3. Подавление шумов ………………………………………………….70 2.4. Подчеркивание граница……………………………………………..74 2.5. Обработка изображений с преобразованием....................................81 2.6. Медианный фильтр……………………………………. ……………85 2.7. Ложные цвета ………………………………………………………..92 2.8. Псевдоцвета ……………………………………. …………………..94 2.9. Улучшение спектрозональных изображений………………………97 2.10. Яркостные преобразования изображений…………………...102 2.10.1 Линейное контрастирование…………………………………….104 2.10.2 Выделение диапазона яркостей…………………………….106 2.10.3 Преобразование изображения в негатив……………………107 2.10.4 Степенные преобразования…………………………………..108 2.10.5 Логарифмическое преобразование…………………………..108 2.10.6 Преобразование гистограмм………………………………...109 2.10.7.Пороговая обработка полутоновых изображений……………..112 2.10.8. Применение табличного преобразованиях изображений…….115 2.10.9. Особенности применения поэлементной обработки цветных изображений............................................................116 2.11.1. Линейное контрастирование изображения…………………….121 2.11.2. Соляризация изображения……………………………………...122 2.11.3. Препарирование изображения …………………………………126 2.11.4. Преобразование гистограмм, эквализация ……………………132 2.11.5. Применение табличного метода при поэлементных преобразованиях изображений…………………………………………138 3. Фильтрация изображений……………………………………………139 3.1. Оптимальная линейная фильтрация. Уравнение Винера-Хопфа..141 5 А.Е. Кононюк Теория искусственного интеллекта 3.2. Масочная фильтрация изображений при наличии аддитивного белого шума………………………………………………147 3.3. Рекуррентная каузальная фильтрация изображений…………….152 3.4. Применение фильтра Винера для некаузальной двумерной фильтрации……………………………………. ......................................158 3.4.1. Двумерное дискретное преобразование Фурье…………………159 3.4.2. Циклическая свертка……………………………………………..164 3.4.3. Решение уравнения Винера-Хопфа в циклическом приближении ……………………………………. .......168 3.5. Байесовская фильтрация изображений …………………………...173 3.5.1. Сущность байесовской фильтрации……………………………..173 3.5.2. Марковская фильтрация одномерных последовательностей….175 3.5.3. Двухэтапная марковская фильтрация изображений ...................179 3.6. Медианная фильтрация…………………………………………….185 3.7. Линейные скалярные и векторные фильтры Калмана…………...191 3.8. Тензорный фильтр Калмана……………………………………….193 3.9. Псевдоградиентные адаптивные алгоритмы прогноза изображений ………………………………………………….199 3.10. Адаптивные псевдоградиентные алгоритмы фильтрации изображений……………………………………. ....................................202 3.11. Матричные фильтры обработки изображений…………………..208 3.12. Применение методов фильтрации изображений………………..217 к фильтрации речевых и других квазипериодических сигналов 4. Восстановлени изображений………………………………………...222 4.1. Модели изображений и их линейных искажений………………..223 4.1.1. Формирование изображений…………………………………….223 4.1.2. Размытие вследствие движения (смаз)…………………………228 4.1.3. Расфокусировка…………………………………………………..231 4.2. Алгебраические методы восстановления изображений…………236 4.3. Методы восстановления изображений на основе пространственной фильтрации………………………………………..239 4.3.1. Инверсный фильтр……………………………………………….241 4.3.2. Фильтр Винера……………………………………………………246 4.3.3. Компенсация краевых эффектов при восстановлении линейно-искаженных изображений……………………………………251 4.4. Итерационные методы восстановления изображений…………..257 5. ГЕОМЕТРИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ И ПРИВЯЗКА ИЗОБРАЖЕНИЙ………………………………………………………..266 5.1. Геометрические преобразования на плоскости и в пространстве…………………………………………267 5.1.1. Точки и прямые линии на плоскости - двойственность описаний…………………………………………………………………268 6 А.Е. Кононюк Теория искусственного интеллекта 5.1.2. Однородные координаты………………………………………..270 5.1.3. Евклидовы преобразования……………………………………..272 5.1.4. Аффинные преобразования……………………………………..274 5.1.5. Проективные преобразования…………………………………..279 5.1.6. Полиномиальное преобразование………………………………288 5.1.7. Оценивание параметров преобразования………………………291 5.2. Восстановление изображения в преобразованных координатах.294 5.3. Привязка изображений…………………………………………….301 5.3.1. Корреляционный критерий сходства……………………………302 5.3.2. Локальное уточнение сдвига…………………………………….307 5.3.3. Кросс-спектральная мера сходства……………………………...308 5.3.4. Привязка по локальным неоднородностям……………………..313 6. ФОТОГРАММЕТРИЯ И СТЕРЕОВИДЕНИЕ……………………..315 6.1. Модель регистрирующей камеры…………………………………316 6.2. Связь между различными системами координат…………………319 6.3. Стереоскопическая система………………………………………..321 6.4. Калибровка камеры…………………………………………………327 6.5. Взаимное ориентирование…………………………………………335 6.6. Поиск сопряженных точек…………………………………………339 7. СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЙ…………………………………347 7.1. Сегментация изображений на основе пороговой обработки…….349 7.2. Сегментация изображений на основе марковской фильтрации………………………………………………...359 7.3. Байесовская сегментация, основанная на распределении Гиббса……………………………………………….367 7.3.1. Распределение Гиббса и его применение к описанию случайных дискретных сигналов и изображений……….368 7.3.2. Байесовская сегментация изображения на основе стохастической релаксации…………………………………374 8. ВЫДЕЛЕНИЕ КОНТУРНЫХ ЛИНИЙ……………………………..382 8.1. Градиентные методы подчеркивания контуров…………………..383 8.2. Ранговое обнаружение локальных контурных признаков……….396 8.2.1. Декорреляция фона изображения………………………………..397 8.2.2. Ранговое обнаружение ЛКП……………………………………..403 9. РАСПОЗНАВАНИЕ ОБЪЕКТОВ НА ИЗОБРАЖЕНИЯХ………..411 9.1. Основные положения………………………………………………411 9.2. Разделяющие функции……………………………………………..416 9.3. Вычисление информативных признаков…………………………420 9.4. Алгоритмы классификации (краткий обзор)…………………….422 9.5. Байесовский метод распознавания……………………………….425 9.6. Вероятности ошибок классификации……………………………437 9.7. Проблема K-классов………………………………………………442 7 А.Е. Кононюк Теория искусственного интеллекта 10. МАТЕМАТИЧЕСКАЯ МОРФОЛОГИЯ И ОБРАБОТКА ИЗОБРАЖЕНИЙ………………………………………………………..443 10.1. Операции математической морфологии…………………………446 10.2. Морфологические операции в дискретном пространстве……...461 11. СЖАТИЕ ИЗОБРАЖЕНИЙ………………………………………..470 11.1. Алгоритмы сжатия без потерь……………………………………471 11.2. Свойства цифровых изображений……………………………….472 11.3. Дискретные преобразования изображений в сжатии данных…474 11.4. Методы сжатия на основе предсказания………………………..480 11.5. Другие алгоритмы…………………………………………………484 12. КОМПЬЮТЕРНАЯ ТОМОГРАФИЯ………………………………487 12.1. Получение проекций………………………………………………489 12.2. Классическая томография………………………………………...498 12.3. Алгоритм обратного проецирования…………………………….499 12.4. Теорема о центральном сечении…………………………………505 12.5. Фурье-алгоритм восстановления томограмм……………………508 12.6. Восстановление томограмм с помощью обратного проецирования………………………………………………514 12.7. Итерационные алгоритмы восстановления томограмм………...524 12.8. Флюктуационные искажения проекционных данных…………..530 13. Обнаружение сигналов на фоне изображений ……………………532 13.1. Общий случай ……………………………………. ………………532 13.2. Обнаружение при гауссовской аппроксимации априорных или апостериорных распределений помех……………….535 13.3. Адаптивный псевдоградиентный алгоритм обнаружения……..542 13.4. Псевдоградиентная оценка квантилей и стабилизация порога обнаружения ……………………………………. …………….542 14. Совмещение изображений …………………………………………549 14.1. Тензорная фильтрация смещений………………………………..550 14.2. Совмещение случайных полей при межкадровых геометрических трансформациях……………………..552 14.3. Совмещение двух кадров гауссовского случайного поля………555 14.4. Псевдоградиентные алгоритмы совмещения случайных полей ………………………………………………………..560 14.4.1. Совмещение при заданной модели трансформации…………..561 14.4.2. Совмещение при незаданной модели трансформации ……….564 14.4.3. Совмещение бинарных изображений………………………….566 14.4.4. Совмещение изображений со значительными яркостными искажениями…………………………………………………………….568 14.5. Применение к распознаванию речевых сигналов………………572 14.5.1. Преобразование команд в изображения………………………573 14.5.2. Идентификация автокорреляционных портретов команд……580 8 А.Е. Кононюк Теория искусственного интеллекта 15. Анализ текстурных изображений…………………………………585 15.1. Описание текстур…………………………………………………585 15.2. Оценка наличия текстуры в изображении………………………594 15.3. Методы сегментации цветных текстур в цветовых координатных пространствах…………………………….596 15.4 Синтез цветных пространственных текстур…………………601 15.4.1 Статистический метод синтеза цветных текстур…………..602 15.4.2 Синтез цветных фрактальных текстур………………………607 15.5 Сегментация цветных текстурных изображений……………610 15.6 Фрактальный анализ сложных текстурных изображений….621 15.6.1 Оценка фрактальности признаков цветных текстур………621 15.6.2 Возможности и ограничения применения алгоритма оценки размера фрактала по длине контура при анализе сложных текстурных изображений…………………………………..622 15.6.3 Сегментация текстурных изображений по методу треугольной пирамиды………………………………….627 15.6.4 Оценка размера фрактала по модулю разности яркостей отсчетов………………………………………………………629 Литература..................... ……………………………………..................637 9 А.Е. Кононюк Теория искусственного интеллекта 1. Представление изображений в цифровой форме Для осуществления цифровой обработки изображений необходимо выполнить преобразование непрерывного (аналогового) сигнала изображений в цифровой массив. Такое преобразование включает выполнение двух преобразований. Первое преобразование представляет замену реального непрерывного изображения набором отсчетов в дискретные моменты времени, такое преобразование называется дискретизацией. Второе - это преобразование непрерывного множества значений сигнала изображения в множество квантованных значений, такое преобразование называется квантованием. Двумерный характер изображения по сравнению с обычными сигналами содержит дополнительные возможности оптимизации цифрового представления с целью сокращения объема получаемых цифровых данных. В связи с этим изучался вопрос о наилучшем размещении уровней квантования, а также об использовании различных растров [1.1...1.3], другие аспекты данной задачи. Следует, однако, сказать, что в подавляющем большинстве случаев на практике применяют дискретизацию, основанную на использовании прямоугольного растра, и равномерное квантование яркости. Это связано с простотой выполнения соответствующих операций и относительно небольшими преимуществами от использования оптимальных преобразований. При использовании прямоугольного растра в окончательном виде цифровое изображение обычно представляет собой матрицу, строки и столбцы которой соответствуют строкам и столбцам изображения. 1.1 Дискретизация изображений Пространственная дискретизация изображения предполагает формирование непрерывной функции в дискретных отсчетах пространственных координат. Пусть функция f(x,y) описывает І исходное непрерывное изображение бесконечных размеров. В идеальной системе дискретизации изображения пространственные отсчеты исходного изображения получаются путем перемножения этой функции с пространственно дискретизирующей функцией, состоящей 10