За дисертационния труд на Петър Ангелов Петров



Дата14.01.2019
Размер94.55 Kb.
#109906
РЕЦЕНЗИЯ

за дисертационния труд на Петър Ангелов Петров

на тема „Интелигентни системи в биоинформатиката: намиране на съответствия между и обединяване на анатомични онтологии ”,

представена за присъждане на образователната и научна степен “доктор ”,

от доц. д-р Данаил Антонов Дочев –

Институт по информационни и комуникационни технологии - БАН

Бях назначен за член на научното жури по процедурата за защита на дисертационния труд на Петър Ангелов Петров (заповед на Ректора на СУ „Св. Клиимент Охридски” № Р038-27/10.01.2013 г.). На първото заседание на научното жури на 22.01.2013 г. бях избран за рецензент и получих материалите по процедурата. На 12.02.2013 г. получих от докторанта електронно писмо с данни за достъп до програмната реализация AnatOM.

Представеният дисертационен труд е написан в обем от 182 страници и се състои от увод, шест следващи глави, списък на използвани съкращения, терминологичен речник със 69 термина на английски и на български език и библиография. В библи­о­графията са посочени 98 заглавия на английски език (от тях 13 електронни публика­ции). 57 от посочените публикации са издадени след 2002 г., а 20 - след 2007 г.

Работата е посветена на безспорно актуална и значима изследова­телска тема от биоинформатиката. Обект на изследване са мето­ди, техники и реализации за откриване на съответствия в онтологични модели от конкретна предметна област (анатомия на животни), насочено към тяхно обединяване. Такъв тип изследвания поставят нетривиални изследователски задачи на семантичните информационни технологии, свързани най-вече с проблеми при концептуализацията на частично припокриващи се мрежи от понятия и оттам – трудности при автоматични обработки на техните информационни образи. Те изискват значителна съвместна работа със специалисти от проблемната област поради междудисциплинния си характер. Голямата ресурсоемкост при създаване на предметни онтологии налага фокусиране на вниманието върху прагматичните въпроси за тяхното споделяне и многократна употреба, пряко свързани с ефективни решения за интегриране на онтологии. Резултатите от такива изследвания определено предизвикват интерес поради разширените възможности за обмен на знания и резултати между специалистите от предметната област (в случая – анатомия).

Глава 1 на дисертационния труд - Увод - представя кратко описание на проблемите при обединяване на анатомични онтологии, тяхната сложност и значение при ползване на хетерогенни източници на данни. Дефинирани са целите и задачите на изследването, свързани с разработване и реализация на метод и алгоритъм за откриване на съответствия в анатомични онтологии и за тяхното обединяване.

Глава 2 представлява стегнат преглед на съвременното състояние при ин­тег­риране на онтологии. Маркирани са основни характеристики на онтоло­гич­ните модели в информатиката и езиците за тяхното представяне, както и при­ла­гането на онтологии в съвременната биология. Представени са по-значими съвременни програмни системи, подпомагащи интегрирането на онтологии.

Глава 3 „Формализация на проблема” представя накратко класически моде­ли от дискретната математика, на които се базират по-нататъшните предста­вяния и обработки на онтологиите. Използва се обичайно представяне на онтологиите като насочени ациклични графи. Разглеждат се само йерархични релации е и част_от (is_a, part_of); естествено, моделите допускат и други асиметрични релации.



Глава 4, основна за дисертацията, е посветена на създадените алгоритми­чни решения за съпоставяне на онтологии и за обединение на онтологии. Тези решения са разработени върху примера на две конкретни входни анатомични онтологиии (за мишка и риба Данио), като за откриване на синоними се използват 3 външни източници на знания (UMLS - Unified Medical Language System на Националната библиотека по медицина на САЩ, FMA – Foundational Model of Anatomy, проект на Унив. на Вашингтон, и WordNet – популярна лексическа база от данни за английски език). Авторът си поставя за цел да се открият/предскажат надеждни от биологична гледна точка семантични връзки между понятията от двете входни онтологии (синоними и връзки е или част_от). Тази задача се решава на три етапа:

  • построяване на речници на входните онтологии;

  • съпоставяне на речниците с външните източници на знания и откриване на синоними на термините от онтологиите, както и на техните хиперними (в посока на генерализация при релация е), хипоними (в посока на специализация), холоними (родители при релация част_от) и мероними (деца при релация част_от);

  • откриване на междуонтологични връзки между понятията от входните онтологии.

Дейностите по първите два етапа са ясни; тяхната реализация изисква професионални програмистки умения. По-голямо внимание заслужава третият етап. Той се осъществява от 3 алгоритмични процедури:

  • Процедура DM (direct matching), откриваща текстови съвпадения на имената на понятията от двете входни онтологии и предсказваща по този начин възможни синоними.

  • Процедура SMP (source matching predictions), откриваща възможни между­онтологични връзки (тип синоними или родители-деца при релации е или част_от) чрез проследяване на графите на входните онтологии, които вече са съпоставени с термините от външните източници на знания.

  • Процедура СMP (child matching predictions), откриваща възможни междуонтологични синонимни връзки на базата на понятията – деца в насочения граф. Процедурата е оригинална, базирана на изследванията на автора.Тя работи върху единствен обединен граф, обединяващ графите на входните онтологии чрез предсказаните възможни междуонтологични връзки, открити чрез процедурите DM и SMP. Процедурата обхожда графа, търсейки три типа шаблони от свързани възли родители-деца на двете входни онтологии. Тя прилага механизъм за оценяване надеждността на предсказаните синонимни връзки на базата на въведени тегла на дъгите на обединения граф (показатели за надеждност на връзките), показатели за надеждност на външните източници на знания и оценъчни функции от вероятностен тип. Експериментирани са 3 схеми за оценяване.

В края на глава 4 е описана алгоритмична процедура за обединяване на две онтологии въз основа на откритите междуонтологични връзки. При нея резултатите от процедурите DM и SMP се оценяват като по-надеждни от предложените от процедурата СMP поради по-директната им връзка с входната информация. Изследвани са възможностите за поява на недопустими цикли в обединения граф (които не съдържат само дъги на синонимни релации), както и мерки за тяхното отстраняване.

В глава 5 е представена реализираната на базата на направените изследвания експериментална програмна система AnatOM. Тя е предназначена за подпомагане на специалисти по анатомия при обединяване на анатомични онтологии. Системата открива възможни междуонтологични връзки, които след това се потвърждават и редактират от потребителя за получаване на обединена онтология. Текстът на глава 5 представя с достатъчни подробности основните модули на програмната система:



  • парсер за въвеждане на входните онтологии, написани на OBO - специализиран език за биологични онтологии;

  • модул за ефективна връзка чрез хеширане към релационни бази от данни – външни източници на знания (използвана СУБД MySQL);

  • библиотека за обработка на графи;

  • логически модул, изпълняващ процедурите DM, SMP и СМР;

  • графичен потребителски интерфейс;

  • модул за визуализиране на графи (реализиращ алгоритъм, базиран на уравновесяване на физически сили);

  • модул за експортиране на резултатните онтологии като OBO файлове.

Системата AnatOM е реализирана в платформата Microsoft.NET, програмен език C#.

Глава 6 представя проведените експерименти с реализираната система AnatOM. Приведени са резултати от автоматично откриване на възможни между­онтологични връзки при три двойки онтологии. Специалисти по анатомия са оценили откритите връзки. Получени са добри резултати при съвместно използване на алгоритмичните процедури: точни предсказания най-малко 93%, частично точни предсказания до 4,8% и напълно неточни предсказания до 1,37%. В главата са коментирани влиянието върху точността на предсказанията на отделните алгоритмични процедури DM, SMP и СМР (поотделно и съвместно), както и на важни характеристики на входните онтологии (гранулярност, близост на описваните организми и др.).

В заключението на работата са споменати някои възможни насоки за развитие на резултатите.

Приемам следните научни и научно-приложни постижения на дисертанта, формулирани в Глава 7 на дисертационния труд:



  1. Направеният аналитичен обзор на характеристиките и проблемите при изграждане и съпоставяне на онтологии в областта на биологията и на някои по-значими решения за сливане на онтологии съдържа приносни елементи за изясняване на структурата и елементите на дейностите по интегриране на предметни онтологии.

  2. В рамките на класическо формално представяне (насочени ациклични графи) са развити три допълващи се алгоритмични процедури за откриване на възможни синонимни междуонтологични връзки между понятията на двете входни онтологии (включително чрез изследване на връзки тип е и част_от). Процедурата SMP (source matching predictions) може да се разглежда като нова, конкретизирана за предметната област комбинация на известни резултати. Процедурата СMP (child matching predictions) е изцяло принос на автора. Тя включва схеми за оценяване на надеждността на предсказаните възможни връзки чрез оценъчни функции от вероятностен тип.

  3. Разработена е формална процедура, основана на две доказани твърдения за графовите модели на онтологигите, която осигурява коректно обединяване на входни онтологии в супер-онтология, съдържаща само допустими цикли (т.е. цикли само от синонимни връзки).

  4. Разработена е програмна система AnatOM за полуавтоматично откриване на медуонтологични връзки и коректно обединяване на анатомични онтологии. Реализираните модел и алгоритми биха позволили несложни модификации за обединяване и на онтологии от други предметни области при вътрешно представяне на предметните онтологии чрез насочени ациклични графи и съответни външни източници на знания, организирани като релационни бази от данни.

  5. Част от обработващите модули на системата AnatOM могат да намерят самостоятелни приложения извън системата (напр. модулите за обработка и визуализация на графи, за трансформиране на ОВО файлове във вид на графи и обратно).

Прави добро впечатление последователния стремеж на автора за яснота и точност в текста на дисертацията – както при представянето на моделите и алгорит­мич­ни­те решения, така и при формулирането на извършената от автора работа.

По дисертацията са представени четири публикации на английски език, от които две са с четирима автори, една – с пет автори и една – със шест автори. Една от публикациите има чуждестранен съавтор. Във всички публикации дисер­тантът е на първо място в авторския колектив, което показва неговото основ­но участие. Две от публикациите са отпечатани в български научни спи­сания (едното с обявен импакт-фактор 0,76), а две са приети за печат в трудове на международни конференции; едната от тях е включена в подборка от статии на конференцията, публикувана в списание BIOMATH, издавано от 2012 г. Трите списания се издават в България с участие на чуждестранни членове в редколегията.

В публикациите са включени основните резултати от дисертационната рабо­та и така те са станали достояние на научната общност в съответната област.

Не са представени данни за цитирания – навярно поради факта, че публикациите по дисертацията са направени през 2012 г.

Авторефератът отразява основните положения и приноси в дисертационната работа.

Анализът на дисертацията и останалите документи ми дават основание да считам, че работата и приносите в нея са в достатъчна степен лично дело на дисертанта.

Към дисертацията и нейното оформление могат да се отправят някои бележки:


  • Има стремеж към използване на ясен език и терминология, организирана в терминологичен речник, но се срещат отделни случаи на излишна употреба на чуждици (напр. пролиферация на данни) или техноло­гичен жаргон (напр. табове).

  • Фиг. 5.1 е на английски език, което не се изисква от нейното съдържание.

  • Не е описана необходимостта от функционално разграничение между дейностите Load Ontology и Load & Persist Ontology при работа със системата (описание на графичния потребителски интерфейс).

  • Необходими са наблюдения за работа на специалисти по анатомия с програм­ната система AnatOM, които да дадат впечатление за използваемост­та на системата - да покажат доколко функционалност­та на систе­мата задоволява потребителите, организацията на дейно­стите е естествена за неспециалисти по информатика и потреби­тел­ският интерфейс е дружелюбен и лесен за използване.

  • В контекста на предната бележка би било интересно да се коментира ролята и реалистичността на началните стойности на показателите за надеждност (ако те са различни от 1), навярно задавани от специалисти от предметната област, в процедурите за предсказване на междуонтологични семантични връзки.

По препоръчителните изисквания към публикациите за образователната и научна степен "доктор" (Чл. 4., т. 1 от „Правилника на ФМИ за приложение на ЗРАСРБ”) се установява следното: представени са 4 публикации в рецензирани издания, от които 3 – в списания, т.е. повече от изискваните поне 2 публикации в рецензирани издания, едно от които да е списание.

Заключение

Резултатите на автора, представени в дисертационния труд, отразяват актуал­ни изследвания в областта на семантичните технологии, насочени и експериментирани в биоинформатиката. Работата в между­дисцип­линни области дава редица предимства, от които авторът успешно се е възполз­вал: добро запознаване с проблемите при използване на предметни онтологични модели, придо­биване на умения за работа в разнороден екип от специалисти и възможност за реална практическа полезност на изследванията.

При разработването на дисертационния труд дисертантът е показал творческа мисъл, добро вникване в изследо­вателските проблеми и значителна задълбоченост при тяхното поставяне и решаване. Той демонстрира познания по разнообразни съвременни методи и инструменти на информационните технологии - създаване и използване на релационни бази от данни, реализация на онтологии, парсиране на изрази от специализиран език, визуализация на резултати и т.н. Разработената програмна система AnatOM е резултат от прилагане на добри професионални умения при разработване на софтуерни приложения с изследователски характер.

Всичко това ми дава основание убедено да препоръчам на почитаемото Научно жури да присъди образователната и научна степен “Доктор” по научната специалност 01.01.12 „Информатика” на дисертанта Петър Ангелов Петров.



София, 06 март 2013 г. РЕЦЕНЗЕНТ:

/доц. д-р Данаил Дочев/
Каталог: index.php -> bul -> content -> download
download -> Литература на народите на Европа, Азия, Африка, Америка и Австралия
download -> Дипломна работа за придобиване на образователно-квалификационна степен " "
download -> Рентгенографски и други изследвания на полиестери, техни смеси и желатин’’ за получаване на научната степен „Доктор на науките”
download -> Св. Климент Охридски
download -> Акад. Илчо иванов димитров (1931 – 2002) фонд 20 опис 1
download -> Азбучен списък на преподавателите
download -> Климент охридски” университетски архив
download -> График за провеждане на семтемврийската (поправителна) изпитна сесия на магистърска програма „политическа социология учебна 2014/2015 г. Поправителна сесия от 24 август до 11 септември 2015 г
download -> Обявява прием на студенти


Сподели с приятели:




©obuch.info 2024
отнасят до администрацията

    Начална страница