„Извличане на знания от много източници на данни



Дата02.01.2018
Размер62.17 Kb.
#39828
РЕЦЕНЗИЯ

относно дисертационен труд



за придобиване на образователна и научна степен „доктор”

в област на висше образование

4. Природни науки, математика и информатика.

Професионално направление: 4.6 Информатика и компютърни науки,

Научна специалност: 01.01.12 – Информатика(Изкуствен интелект)

Кандидат: Гергана Ангелова Лазарова

Тема: „Извличане на знания от много източници на данни”

Научен ръководител: проф. др Иван Койчев

Изготвил рецензията: доц. д-р Александър Геров

Тази рецензия е написана и представена на основание на заповед РД 38-729/14.12.2015 на Ректора на СУ „Св. Климент Охридски”, както и на решението на научното жури по процедурата. Тя е изготвена въз основа на ЗРАСРБ, Правилника за прилагане на ЗРАСРБ, Правилника за условията и реда за придобиване на научни степени и за заемане на академични длъжности във Факултета по математика и информатика на СУ „Св. Климент Охридски” и според Указания за изготвяне на рецензии и становища от членове на научни журита и за документите в електронен вид, подавани от кандидата по процедури за академични длъжности и научни степени на Факултета по математика и информатика на СУ “Св. Климент Охридски”.



  1. Съдържателен анализ на научните и научно-приложните постижения в дисертационния труд. Характеризиране на основните постижения.

Дисертационният труд се състои от 118 страници на английски език. Оформен е в увод, пет глави, заключение и библиография. Съдържа 9 таблици и 26 фигури. Използваната литература е 100 заглавия на английски език и 1 на български.

Актуалност на проблема

От втората половина на миналия век научната област Изкуствен интелект се развива интензивно. В тази област се включват различни направления. Едно от тях е машинното обучение, при което въз основа на множество от класифицирани примери се изгражда алгоритъм за предсказване на нови знания. Актуален проблем е как при машинното обучение да се включват и некласифицирани примери при недостиг на достатъчно много класифицирани примери, така че да се получи смесено машинно обучение. Особено переспективно е търсенето на начини за прилагане на смесеното машинно обучение при сегментация на изображения и при оценка на чувствата. Последното има важно приложение в редица области - както при избор на продуктова стратегия в производството и в търговията, така и при оценка на политически послания или при изработване на визия в развлекателната индустрия. Проблемите, които възникват, са свързани с необходимостта да се ползват примери от разнообразни източници, които много често не са класифицирани или са трудоемки за класификация. Разрешаването на тези проблеми изисква намиране на нови подходи за смесено машинно обучение при използване на различни източници на информация.

Развитието на тази проблематика представлява интерес не само като фундаментални научни изследвания, а и като значими приложни разработки за анализ на големи масиви от неструктурирани данни и получаването в резултат на това на един различен поглед над динамиката на пазарите.

Горното предпоставя високата актуалност на изследванията в областта на системите за препоръчване на съдържание на социалните мрежи.



Познаване на състоянието на проблема

Извършените в Глава 2 анализ и класификация на различните видове машинно обучение показват задълбоченото познаване на проблема. Представени и оценени са различните видове машинно обучение – учене с учител (регресия и квалификация), учене без учител и смесено машинно обучение.

Използваните литературни източници са още едно доказателство, че кандидатът владее в детайли проблема.

Подход и решение на проблема

Изследвани са нуждите на потребителите от предсказващи системи в области, в които имаме големи обеми от данни, но класифицираните такива са малък брой, а и класифицирането на данни е труден и времеемък процес. Поради това се търси решение на проблема с алгоритми за смесено машинно обучение чрез използване на много източници на данни и въвеждане на паралелизация по класификационните класове.

Подходът за решаване на задачата за предсказване на чувствата в текст на български език е да се приложи машинно обучение, като се ползват класифицирани ревюта от английски източници и некласифицирани ревюта от български източници. Използва се и автоматичен машинен превод с Google Translate.

Експериментирането на предложените системи е съчетано със сравнителен анализ.



Основни приноси

Постигнатите резултати в изпълнение на задачите на дисертационния труд са:



  • Разработен е нов подход в областта на смесеното машинно обучение от много източници на данни с минимизиране на общата грешка;

  • Оценка на генетичния алгоритъм за минимизиране на общата грешка в система, предсказваща чувства в текст на български език;

  • Проведени са експерименти за проверка на разработените в дисертацията методи и са анализирани резултатите от тях.

Анализ на научните и научно-приложните постижения в дисертационния труд

Първа глава представя актуалността на темата на дисертацията, както и целта и задачите в нея. Във Втора глава е направено проучване и анализ на съвременното състояние на проблема. Подробно са разгледани изследванията и постиженията до момента в областта на маишинното обучение – учене с учител, учене без учител, смесено машинно обучение от един и от много източници на данни. В Трета глава е представен нов подход за смесено машинно обучение от много източници на данни, като се използва генетичен алгоритъм за кръстосване, добавяне и мутация на векторите на теглата за характеристиките от изгледите (източниците на данни). В Четвърта глава се въвежда дисциплината Оценка на чувствата. Развита е оргинална система за предсказване на чувства в текст на български език, която ползва два източника на данни – английски и български – и се основава на генетичния алгоритъм за смесено машинно обучение от много изгледи, представен в предната глава. Пета глава е посветена на избора на нов обучаващ алгоритъм, базиран на много изгледи, който да се използва при сегментация на изображения. Шеста глава представя система за сегментация на изображения, използваща изгледи с координация на пиксели и със стойности на пиксели. В Седма глава са представени евентуални переспективи за бъдещата работа по темата. Дисертацията приключва с Осма глава, която изброява приносите и направените публикации.

Съществени приноси в дисертацията са:



  • Разработен е оргинален генетичен алгоритъм за смесено машинно обучение от много източници на данни;

  • Модифициран е базовия алгоритъм за взаимно обучение при много източници на данни в случай, че единият изглед е по-лош от другия. Решението е в предварителна корекция на по-лошия класификатор въз основа на по-добрия;

  • Реализирана е система за предсказване на чувства в текст на български език, използваща квалифицирани английски ревюта и неквалифицирани български ревюта за обучение и работеща в разпределена среда за паралелни изчисления;

  • Разработена е система за сегментация на изображения, използваща два изгледа – координатите и стойностите на пикселите.

Достоверност на получените резултати

За достоверността на дисертацията говорят шестте обширни публикации и изнесените доклади по темата на дисертацията, също така цитирането на една от публикациите.



  1. Общо описание на публикациите, които отразяват дисертацията – монографии, статии, свидетелства и патенти, класифицирани по тематика или друг признак и редуцирани поради съвпадение или припокриване

Според правилника на ФМИ за образователната и научна степен “доктор” се изискват поне 2 публикации в рецензирани издания, поне едно от които да е списание. По дисертацията има 6 публикации, като 2 са в сборници с доклади на международни конференции, 2 са в рецензирани издания и 2 - в сборници от национални конференции. Две от публикациите са на български, а останалите на английски език. Освен това част от резултатите са представени и в три доклада в чужбина и у нас.

Публикациите отразяват основните научни и научно приложни резултати, постигнати в дисертацията.



  1. При колективни публикации да се отрази приноса на кандидата.

Една публикация и един доклад са самостоятелни, три публикации и два доклада са в съавторство с научния ръководител на докторанта и две публикации – в съавторство и с други колеги.

  1. Качества на автореферата, включително доколко правилно отразява приносите на дисертацията

Авторефератът отразява точно и пълно основните резултати, постигнати в дисертацията.

  1. Заключение

Представеният за рецензиране дисертационен труд отговаря на изискванията на Закона за РАСРБ и на съответните Правилници на МОНМ, СУ и ФМИ.

Предвид горното и поради съществените научни приноси на кандидата в дисертационния труд, давам положителна оценка и убедено предлагам на уважаемото жури да присъди на Гергана Ангелова Лазарова образователната и научна степен “доктор” в област на висше образование, 4.0. Природни науки, математика и информатика, професионално направление 4.6. Информатика и компютърни науки, научна специалност: 01.01.12. Информатика (Информатика – Изкуствен интелект).

29 февруари 2016 г. Рецензент:

/доц. д-р Александър Геров/




Каталог: index.php -> bul -> content -> download
download -> Литература на народите на Европа, Азия, Африка, Америка и Австралия
download -> Дипломна работа за придобиване на образователно-квалификационна степен " "
download -> Рентгенографски и други изследвания на полиестери, техни смеси и желатин’’ за получаване на научната степен „Доктор на науките”
download -> Св. Климент Охридски
download -> Акад. Илчо иванов димитров (1931 – 2002) фонд 20 опис 1
download -> Азбучен списък на преподавателите
download -> Климент охридски” университетски архив
download -> График за провеждане на семтемврийската (поправителна) изпитна сесия на магистърска програма „политическа социология учебна 2014/2015 г. Поправителна сесия от 24 август до 11 септември 2015 г
download -> Обявява прием на студенти


Сподели с приятели:




©obuch.info 2024
отнасят до администрацията

    Начална страница