Table Of ContentПарадигма развития науки
А. Е. Кононюк
Основы фундаментальной
теории искусственного
интеллекта
Книга 3
Зрительное восприятие
изображений искусственным
интеллектом
Часть 2
Киев
«Освіта України»
2017
А.Е. Кононюк Теория искусственного интеллекта
Кононюк Анатолий Ефимович
2
А.Е. Кононюк Теория искусственного интеллекта
3
А.Е. Кононюк Теория искусственного интеллекта
УДК 51 (075.8)
ББК В161.я7
К65
Рецензент:
Н.К.Печурин - д-р техн. наук, проф. (Национальный
авиационный университет).
Кононюк А. Е.
К213 Основы фундаментальной теория искусственного
интеллекта. — В 20-и кн. Кн.3, ч.2. — К.:Освіта України.
2017.—545 с.
ISBN 978-966-373-693-8 (многотомное издание)
ISBN 978-966-373-694-8 (книга 3, ч.2)
Многотомная работа посвящена систематическому
изложению общих формализмов, математических моделей и
алгоритмических методов, которые могут быть
исспользуемых при моделировании и исследованиях
математических моделей объектов искусственного
интеллекта.
Развиваются представления и методы решения, основанные
на теориях эвристического поиска и автоматическом
доказательстве теорем, а также процедуральные методы,
базирующиеся на классе проблемно-ориентированных
языков, сочетающих свойства языков программирования и
автоматических решателей задач отображения
искусственного интеллекта различными математическими
средствами.
В работе излагаются основы теории отображения
искусственного интеллекта такими математическими
средствами как: множества, отношения, поверхности,
пространства, алгебраические системы, матрицы, графы,
математическая логика и др.
Для бакалавров, специалистов, магистров, аспирантов,
докторантов всех специальностей.
УДК 51 (075.8)
ББК В161.я7
ISBN 978-966-373-693-8 (многотомное издание) © Кононюк А. Е., 2017
ISBN 978-966-373-694-8 (книга 3,ч. 2) © Освіта України, 2017
4
А.Е. Кононюк Теория искусственного интеллекта
Оглавление
1. Представление изображений в цифровой форме……………………10
1.1 Дискретизация изображений…………………………………….10
1.2 Квантование изображений……………………………………….27
1.2.1 Оптимальное квантование……………………………………….38
1.2.2 Квантование сигнала при наличии шумов……………………...41
1.3. Погрешности дискретного представления изображений……..44
1.3.1 Погрешность дискретизации…………………………………..44
1.3.2 Погрешность квантования……………………………………...46
1.4 Методы интерполяции изображений……………………………47
2. Улучшение изображений……………………………………………...51
2.1. Изменение контраста………………………………………………..52
2.2. Видоизменение гистограмм ………………………………………..63
2.3. Подавление шумов ………………………………………………….70
2.4. Подчеркивание граница……………………………………………..74
2.5. Обработка изображений с преобразованием....................................81
2.6. Медианный фильтр……………………………………. ……………85
2.7. Ложные цвета ………………………………………………………..92
2.8. Псевдоцвета ……………………………………. …………………..94
2.9. Улучшение спектрозональных изображений………………………97
2.10. Яркостные преобразования изображений…………………...102
2.10.1 Линейное контрастирование…………………………………….104
2.10.2 Выделение диапазона яркостей…………………………….106
2.10.3 Преобразование изображения в негатив……………………107
2.10.4 Степенные преобразования…………………………………..108
2.10.5 Логарифмическое преобразование…………………………..108
2.10.6 Преобразование гистограмм………………………………...109
2.10.7.Пороговая обработка полутоновых изображений……………..112
2.10.8. Применение табличного преобразованиях изображений…….115
2.10.9. Особенности применения поэлементной
обработки цветных изображений............................................................116
2.11.1. Линейное контрастирование изображения…………………….121
2.11.2. Соляризация изображения……………………………………...122
2.11.3. Препарирование изображения …………………………………126
2.11.4. Преобразование гистограмм, эквализация ……………………132
2.11.5. Применение табличного метода при поэлементных
преобразованиях изображений…………………………………………138
3. Фильтрация изображений……………………………………………139
3.1. Оптимальная линейная фильтрация. Уравнение Винера-Хопфа..141
5
А.Е. Кононюк Теория искусственного интеллекта
3.2. Масочная фильтрация изображений при наличии
аддитивного белого шума………………………………………………147
3.3. Рекуррентная каузальная фильтрация изображений…………….152
3.4. Применение фильтра Винера для некаузальной двумерной
фильтрации……………………………………. ......................................158
3.4.1. Двумерное дискретное преобразование Фурье…………………159
3.4.2. Циклическая свертка……………………………………………..164
3.4.3. Решение уравнения Винера-Хопфа
в циклическом приближении ……………………………………. .......168
3.5. Байесовская фильтрация изображений …………………………...173
3.5.1. Сущность байесовской фильтрации……………………………..173
3.5.2. Марковская фильтрация одномерных последовательностей….175
3.5.3. Двухэтапная марковская фильтрация изображений ...................179
3.6. Медианная фильтрация…………………………………………….185
3.7. Линейные скалярные и векторные фильтры Калмана…………...191
3.8. Тензорный фильтр Калмана……………………………………….193
3.9. Псевдоградиентные адаптивные алгоритмы
прогноза изображений ………………………………………………….199
3.10. Адаптивные псевдоградиентные алгоритмы фильтрации
изображений……………………………………. ....................................202
3.11. Матричные фильтры обработки изображений…………………..208
3.12. Применение методов фильтрации изображений………………..217
к фильтрации речевых и других квазипериодических сигналов
4. Восстановлени изображений………………………………………...222
4.1. Модели изображений и их линейных искажений………………..223
4.1.1. Формирование изображений…………………………………….223
4.1.2. Размытие вследствие движения (смаз)…………………………228
4.1.3. Расфокусировка…………………………………………………..231
4.2. Алгебраические методы восстановления изображений…………236
4.3. Методы восстановления изображений на основе
пространственной фильтрации………………………………………..239
4.3.1. Инверсный фильтр……………………………………………….241
4.3.2. Фильтр Винера……………………………………………………246
4.3.3. Компенсация краевых эффектов при восстановлении
линейно-искаженных изображений……………………………………251
4.4. Итерационные методы восстановления изображений…………..257
5. ГЕОМЕТРИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ И ПРИВЯЗКА
ИЗОБРАЖЕНИЙ………………………………………………………..266
5.1. Геометрические преобразования
на плоскости и в пространстве…………………………………………267
5.1.1. Точки и прямые линии на плоскости - двойственность
описаний…………………………………………………………………268
6
А.Е. Кононюк Теория искусственного интеллекта
5.1.2. Однородные координаты………………………………………..270
5.1.3. Евклидовы преобразования……………………………………..272
5.1.4. Аффинные преобразования……………………………………..274
5.1.5. Проективные преобразования…………………………………..279
5.1.6. Полиномиальное преобразование………………………………288
5.1.7. Оценивание параметров преобразования………………………291
5.2. Восстановление изображения в преобразованных координатах.294
5.3. Привязка изображений…………………………………………….301
5.3.1. Корреляционный критерий сходства……………………………302
5.3.2. Локальное уточнение сдвига…………………………………….307
5.3.3. Кросс-спектральная мера сходства……………………………...308
5.3.4. Привязка по локальным неоднородностям……………………..313
6. ФОТОГРАММЕТРИЯ И СТЕРЕОВИДЕНИЕ……………………..315
6.1. Модель регистрирующей камеры…………………………………316
6.2. Связь между различными системами координат…………………319
6.3. Стереоскопическая система………………………………………..321
6.4. Калибровка камеры…………………………………………………327
6.5. Взаимное ориентирование…………………………………………335
6.6. Поиск сопряженных точек…………………………………………339
7. СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЙ…………………………………347
7.1. Сегментация изображений на основе пороговой обработки…….349
7.2. Сегментация изображений на основе
марковской фильтрации………………………………………………...359
7.3. Байесовская сегментация, основанная
на распределении Гиббса……………………………………………….367
7.3.1. Распределение Гиббса и его применение
к описанию случайных дискретных сигналов и изображений……….368
7.3.2. Байесовская сегментация изображения
на основе стохастической релаксации…………………………………374
8. ВЫДЕЛЕНИЕ КОНТУРНЫХ ЛИНИЙ……………………………..382
8.1. Градиентные методы подчеркивания контуров…………………..383
8.2. Ранговое обнаружение локальных контурных признаков……….396
8.2.1. Декорреляция фона изображения………………………………..397
8.2.2. Ранговое обнаружение ЛКП……………………………………..403
9. РАСПОЗНАВАНИЕ ОБЪЕКТОВ НА ИЗОБРАЖЕНИЯХ………..411
9.1. Основные положения………………………………………………411
9.2. Разделяющие функции……………………………………………..416
9.3. Вычисление информативных признаков…………………………420
9.4. Алгоритмы классификации (краткий обзор)…………………….422
9.5. Байесовский метод распознавания……………………………….425
9.6. Вероятности ошибок классификации……………………………437
9.7. Проблема K-классов………………………………………………442
7
А.Е. Кононюк Теория искусственного интеллекта
10. МАТЕМАТИЧЕСКАЯ МОРФОЛОГИЯ И ОБРАБОТКА
ИЗОБРАЖЕНИЙ………………………………………………………..443
10.1. Операции математической морфологии…………………………446
10.2. Морфологические операции в дискретном пространстве……...461
11. СЖАТИЕ ИЗОБРАЖЕНИЙ………………………………………..470
11.1. Алгоритмы сжатия без потерь……………………………………471
11.2. Свойства цифровых изображений……………………………….472
11.3. Дискретные преобразования изображений в сжатии данных…474
11.4. Методы сжатия на основе предсказания………………………..480
11.5. Другие алгоритмы…………………………………………………484
12. КОМПЬЮТЕРНАЯ ТОМОГРАФИЯ………………………………487
12.1. Получение проекций………………………………………………489
12.2. Классическая томография………………………………………...498
12.3. Алгоритм обратного проецирования…………………………….499
12.4. Теорема о центральном сечении…………………………………505
12.5. Фурье-алгоритм восстановления томограмм……………………508
12.6. Восстановление томограмм с помощью
обратного проецирования………………………………………………514
12.7. Итерационные алгоритмы восстановления томограмм………...524
12.8. Флюктуационные искажения проекционных данных…………..530
13. Обнаружение сигналов на фоне изображений ……………………532
13.1. Общий случай ……………………………………. ………………532
13.2. Обнаружение при гауссовской аппроксимации
априорных или апостериорных распределений помех……………….535
13.3. Адаптивный псевдоградиентный алгоритм обнаружения……..542
13.4. Псевдоградиентная оценка квантилей и стабилизация
порога обнаружения ……………………………………. …………….542
14. Совмещение изображений …………………………………………549
14.1. Тензорная фильтрация смещений………………………………..550
14.2. Совмещение случайных полей при
межкадровых геометрических трансформациях……………………..552
14.3. Совмещение двух кадров гауссовского случайного поля………555
14.4. Псевдоградиентные алгоритмы совмещения
случайных полей ………………………………………………………..560
14.4.1. Совмещение при заданной модели трансформации…………..561
14.4.2. Совмещение при незаданной модели трансформации ……….564
14.4.3. Совмещение бинарных изображений………………………….566
14.4.4. Совмещение изображений со значительными яркостными
искажениями…………………………………………………………….568
14.5. Применение к распознаванию речевых сигналов………………572
14.5.1. Преобразование команд в изображения………………………573
14.5.2. Идентификация автокорреляционных портретов команд……580
8
А.Е. Кононюк Теория искусственного интеллекта
15. Анализ текстурных изображений…………………………………585
15.1. Описание текстур…………………………………………………585
15.2. Оценка наличия текстуры в изображении………………………594
15.3. Методы сегментации цветных текстур
в цветовых координатных пространствах…………………………….596
15.4 Синтез цветных пространственных текстур…………………601
15.4.1 Статистический метод синтеза цветных текстур…………..602
15.4.2 Синтез цветных фрактальных текстур………………………607
15.5 Сегментация цветных текстурных изображений……………610
15.6 Фрактальный анализ сложных текстурных изображений….621
15.6.1 Оценка фрактальности признаков цветных текстур………621
15.6.2 Возможности и ограничения применения алгоритма
оценки размера фрактала по длине контура при анализе
сложных текстурных изображений…………………………………..622
15.6.3 Сегментация текстурных изображений
по методу треугольной пирамиды………………………………….627
15.6.4 Оценка размера фрактала по модулю разности
яркостей отсчетов………………………………………………………629
Литература..................... ……………………………………..................637
9
А.Е. Кононюк Теория искусственного интеллекта
1. Представление изображений в
цифровой форме
Для осуществления цифровой обработки изображений необходимо
выполнить преобразование непрерывного (аналогового)
сигнала изображений в цифровой массив. Такое преобразование
включает выполнение двух преобразований. Первое преобразование
представляет замену реального непрерывного изображения набором
отсчетов в дискретные моменты времени, такое преобразование
называется дискретизацией. Второе - это преобразование
непрерывного множества значений сигнала изображения в множество
квантованных значений, такое преобразование называется
квантованием.
Двумерный характер изображения по сравнению с обычными
сигналами содержит дополнительные возможности оптимизации
цифрового представления с целью сокращения объема получаемых
цифровых данных. В связи с этим изучался вопрос о наилучшем
размещении уровней квантования, а также об использовании
различных растров [1.1...1.3], другие аспекты данной задачи. Следует,
однако, сказать, что в подавляющем большинстве случаев на практике
применяют дискретизацию, основанную на использовании
прямоугольного растра, и равномерное квантование яркости. Это
связано с простотой выполнения соответствующих операций и
относительно небольшими преимуществами от использования
оптимальных преобразований. При использовании прямоугольного
растра в окончательном виде цифровое изображение обычно
представляет собой матрицу, строки и столбцы которой соответствуют
строкам и столбцам изображения.
1.1 Дискретизация изображений
Пространственная дискретизация изображения предполагает
формирование непрерывной функции в дискретных отсчетах
пространственных координат. Пусть функция f(x,y) описывает
І
исходное непрерывное изображение бесконечных размеров. В
идеальной системе дискретизации изображения пространственные
отсчеты исходного изображения получаются путем перемножения этой
функции с пространственно дискретизирующей функцией, состоящей
10