В Ъ П Р О С Н И К
за изпит по курса
"Обработка и разпознаване на образи"
за специализациите “Изкуствен интелект” и "Компютърна графика”
от магистърската програма на ФМИ, СУ, пролетен семестър, 2009г..
( лектор: ст.н.с. д-р Димо Т. Димов, ИИТ-БАН, тел. 870-64-93
e-mail: dtdim@iinf.bas.bg )
1. Обработка на изображения и разпознаване на образи. Основни понятия. Разпознаване на двумерни образи [3,5]. Интензитет и цвят [11]. Видове приложни задачи. Разпознаване на текст и графика. Компютърен анализ на документи [2, 37]. Биометрика и разпознаване [25].
2. Цифрово представяне на изображенията. Трансформация на Фурие и теорема на Шенон. Шум в изображенията. Косинус трансформация [5,4,7,24].
3. Методи и средства за въвеждане и извеждане на изображения. Растерни и векторни представяния. Обработка на полутонови изображения. Повишаване на качеството на изображенията и подтискане на шума. Хистограмни подходи [7,24,25].
4. Обработка на полутонови изображения. Сегментация по ниво. Бинаризация на графични изображения. Методи за оптимален праг на бинаризацията [7,34,36,20].
5. Линейни филтри за обработка на полутонови изображения. Представяне в обектното и в честотното пространство. Диференциални филтри. Нелинейни филтри [9,4,24,25].
6. Методи за регистриране на графични елементи в изображенията. Трансформация на Хаф за линейни отсечки. Връзка с трансформация на Радон. Приложения при разпознаване на текст и графика [31,21,27,5,7].
7. Методи за извличане на графични признаци. Оконтуряване. Скелетизация. Изтъняване. Нормализация. Векторизиране. Верижни кодове. Трансформация на разстоянията [7,25,32].
8. Извличане на информативни признаци за класификация. Линейно пространство на признаците. Подобие на обекти. Разстояние между обекти. Класове от обекти. Разделящи повърхности [12,14,25,22].
9. Преобразуване на растерни изображения чрез трансформация на Фурие. Преобразуване на векторни изображения. Приложения при разпознаване на графика [16,24,4].
10. Вероятностни и статистически методи за разпознаване. Подход на Бейс. Гаусово разпределение и разстояние по Мехаланобис. Методи за разпознаване по разстояние [5,1,14].
11. Методи за обучение. Обучение с учител - параметрични и непараметрични подходи. Линеен дискриминант на Фишер. Обучение без учител – minimax, kMeans, Izodata [5, 12].
12. Детерминирани методи за разпознаване - методи за точно и еластично сравняване. Взаимна корелация между образ и еталон. Бързо изчисление по Фурие [5,4].
13. Вълнови трансформации на сигнали. Дървовидни представяния в дискретния случай. Обобщение за изображения. Честотни интерпретации. Идея за компресия [18,33].
14. Собствени вектори и собствени стойности на ковариационна матрица. Метод на главните компоненти за редуциране на признаковото пространство [14].
15. Метод на собствените лица (собствените обекти) за разпознаване на физиономии (обекти) [39]. Линеен дискриминант на Фишер при разпознаването на лица [40].
16. Марковски вериги и вероятностни автомати. Скрити Марковски модели за разпознаване на говорни сигнали. Понятие за кепстър на говорен сигнал [35,42,43,28].
17. Вероятностни подходи за комбиниране на класификатори. Повишаване на достоверността на разпознаването чрез речник с образци. Разстояние между низове [41,26,30].
18. Съдържателно базирани методи за достъп в БД с изображения (CBIR) [38,28,22]
(*) 19. Невронни мрежи за построяване на класификатори. Асоциативна памет на Хопфийлд. Обучение при нелинеен многослоен перцептрон. Състезателно обучение [6,19,17,3].
(*) 20. Синтаксично структурирани подходи за разпознаване на образи [3, 25,16,13].
(*) 21. Статистическо обучение чрез опорни вектори (SVM) [44].
( Въпроси 19-21 са опционални. )
Литература (на бълг./рус./англ.):
-
Афифи А., С. Эйзен: Статистический анализ - подход с использованием ЭВМ. "Мир", М., 1982г.
-
Горский Н., В. Анисимов, Л. Горская: Распознавание рукописного текста - от теории к практике. "Политехника", Санкт-Петербург, 1997.
-
Гочев Г.: Компютърно зрение и невронни мрежи. ТУ-София, 1998.
-
Доневска С., Б. Доневски: Бързо преобразувание на Фурие, ТУ-София, 1999.
-
Дуда Р., П. Харт: Распознавание образов и анализ сцен. (перев. с англ.), "Мир", М, 1976.
Duda R.O., P.E. Hart, D.G. Stock: Pattern Classification (2d ed.), John Wiley & Sons, Inc., 2001.
-
Кирова Т.: Невронни мрежи - основни архитектури и обучаващи алгоритми. TEMPUS JEN 1497, СОФТЕХ, С., 1995.
-
Павлидис Т.: Алгоритмы машинной графики и обработка изображений. "Радио и связь", М., 1986.
-
Пенков И., К. Караиванов: Графични файлови формати. "MOUSE", С.,1994.
-
Пратт У.: Цифровая обработка изображений, част I+II, (перев. с англ.), "Мир", М, 1982.
Pratt, W.K.: Digital Image Processing (3th ed.), John Wiley & Sons, Inc., 2001
-
Ту Д. Т., Р. К. Гонзалес: Принципы распознавания образов. (перев. с англ.), "Мир", М, 1978.
-
Фоли Дж., А. вэн Дам: Основы интерактивной машинной графики. "Мир", том 2, Москва, 1985.
-
Фор А.: Восприятие и распознавание образов. "Машиностроение", Москва, 1989.
-
Фу К.: Структурные методы в распознавании образов (перев. с англ.), "Мир", Москва, 1977.
-
Фукунага К. Введение в статистическую теорию распознавания образов. "Наука", М., 1979.
______
-
Baxes G. A.: Digital Image Processing - principles and applications, J. Wiley Sons, Inc., NY, 1994.
-
Fundamentals in Handwriting Recognition. In S. Impedovo (ed.), NATO ASI Series, "F": Computer and System Sciences, Vol. 124, Springer-Verlag, Berlin, 1994.
-
Haykin S: Neural Networks. Macmillan College Publ., Inc. 1994.
-
Mallat S.: A Wavelet Tour of Signal Processing, 2-d ed., San Diego: Academic Press, 1998.
-
Masters T.: Signal and image processing with neural networks, John Wiley & Sons, Inc., NY, 1993.
-
Progress in Handwriting Recognition, in A. C. Downton and S. Impedovo (Eds.), World Scientific, London, 1997.
-
Proceedings of 2001 Int. Conf. on Image Processing, Vol. I-III, 7-10 Oct., 2001, Thessaloniki, Greece.
-
Proceedings of NATO ASI, Multisensor Data and Information Processing for Rapid and Robust Situation and Threat Assessment, 16-27 May 2005, Albena-Bulgaria , IOS Press, 2007.
-
Optical Character Recognition. In the Special Issue of Proceedings of the IEEE, in Pavlidis T. and S. Mori (Eds.), Vol. 80, No. 7, July 1992.
-
Pitas, I: Digital Image Processing – Algorithms and Application, John Wiley and Sons, Inc., NY, 2000
-
Sonka M., V. Hlavac, R. Boyle: Image Processing, Analysis, and Machine Vision, 2-d edition, Brooks/Cole Publishing Co., CA, 1998.
-
Zaniolo, C., S. Ceri, C. Faloutsos, R. T. Snodgrass, V.S.Subrahmanian, R.Zicari: Advanced Database Systems, Morgan Kaufmann Publ., Inc., San Francisco, CA, 1997.
-
Working papers of IIT-BAS, 13 (1995), 33 (1996), 49 (1997), 69 (1998), 135 (2001), 151 (2002).
-
Cybernetics and Information Technologies, IIT-BAS, Vol.4/2 (2004), Vol.8/3 (2008).
-
IEEE Trans. on Pattern Recognition & Machine Intelligence, 1997-2008.
Допълнително (отделни статии):
-
Bunke H.: Recent Advances in String Matching. In H. Bunke (ed.) Series on Machine Perception & Artificial Intelligence "Advances in Structural and Syntactic Pattern Recognition", Vol.5, World Scientific, 1992, pp.3-21.
-
Illingworth J., J. Kittler: A Survey of the Hough Transform, Comp. Vision, Graphics, and Image Proc. 44 (1988) 87-116.
-
Gunilla Borgefors: Distance Transformations in Digital Images, Comp. Vision, Graphics, and Image Proc. 34 (1986) 344-371.
-
Mallat S.: A theory for multiresolution signal decomposition: the wavelet representation, IEEE Trans. on PAMI, vol. II, No. 7, (1989) 674-693.
-
Otsu N.: A Threshold Selection Method from Gray-Level Historgams, IEEE Trans. on Systems, Man, and Cybernetics, Vol.9, No.1 (1979) 62-66.
-
Rabiner, L., B.-H. Juang, Fundamentals of Speech Recognition, Reading: Prentice Hall, New Jersey, 1993, ISBN 0-13-015157-2.
-
Sahoo P. K., S. Soltani, A.-K. C. Wong: A Survey of Thresholding Techniques. Comput. Vision, Graphics and Image processing, Vol.41, No.2 (1988) 233-260.
-
Schuermann J., at al: Document Analysis - from pixels to content, Proc. of IEEE, vol.80, n.7, 1992, pp.1101-1119
-
Smeulders, A.W.M., M. Worring, S. Santini, A. Gupta, and R. Jain: Content-Based Image Retrieval at the End of the Early Years, IEEE Trans. on PAMI, 22, 12, (2000), pp. 1349-1380.
-
Turk M., A. Pentland: Eigen faces for Recognition, Journal of Cognitive Neuroscience, Vol.3, No.1, MIT, 1991, pp.71-86
-
Belhumeur, P.N., J.P. Hespanha, and D.J. Kriegman, Eigenfaces vs. Fisherfaces: Recognition Using Class Specific Linear Projection, IEEE Trans. on PAMI, vol. 19, no. 7, 1997, pp.711-720.
-
Xu L., A. Krzyzak, C.Y. Suen: Methods of Combining Multiple Classifiers and Their Applications to Handwriting Recognition. IEEE Trans.on Systems, Man, and Cybernetics, Vol.22, No.3, 1992, pp.418-435.
-
Cernocky J., Hidden Markov Models - an Introduction, Brno University of Technology, Faculty of Information Technology, (http://www.fit.vutbr.cz/~cernocky/oldspeech/lectures/hmm.pdf )
-
Dunn B., Speech Signal Processing and Speech Recognition, Current Topica in DSP, Speech Proc.2, RBD, May 13, 2003, 34p. (http://www.caip.rutgers.edu/~rabinkin/DSP_no_audio.pdf)
-
Bousquet, O., S. Boucheron, and G Lugosi, Introduction to Statistical Learning Theory, pp.175-213.
(http://www.econ.upf.edu/~lugosi/mlss_slt.pdf )
София, 06.07.2009г. Съставил: / лекторът /
Сподели с приятели: |