СТАНОВИЩЕ
от проф. д-р инж. Никола Рашков Лютов,
член на жури по чл. 4 от Закона за развитие на академичния състав в Република България (обн. ДВ38/21.05.2010, изм. ДВ81/15.10.2010,изм. ДВ101/28.12.2010), съгласно решение на Факултетния съвет на Факултет по математика и информатика от 17.09.2012, протокол № 7 и назначен със заповед № РД 38-436 от 02.10.2012 г. на Ректора на СУ „Св. Климент Охридски“
във връзка със защитата на Ина Асенова Найденова
задочен докторант по професионално направление 4.6 Информатика и компютърни науки (научна специалност 01.01.12 Информатика – Бази данни)
на тема „Приложение на Data Warehouse системи за разкриване на знания: Разреденост на данните в многомерния аналитичния модел“
за присъждане на образователната и научна степен „доктор“,
с научен ръководител доц. д-р Калинка Михайлова Калоянова
1. Актуалност на проблема
Все по-широкото използване на ERP (Enterprise Resource Planning) и BI (Business Intelligence). системите в практиката предполага съхраняването и използването на големи количества данни и тяхната обработка в реално време за получаване на аналитична информация, необходима на управлението на всяка фирма или организация. Това изисква, от една страна, комплексни и все по-сложни модели на данните, от друга, аналитичните системите трябва да предоставят средства за гъвкав анализ –интерактивност и динамичност за създаване на различни сегменти и погледи върху анализираните обекти, което предполага многоаспектни, но лесни за използване и интерпретация модели. Основните проблеми в областта на аналитичните решения са ниското бързодействие, лошото качеството на данните и проблеми от административен характер. Именно на решаването на някои задачи от тази актуална област,е посветен представеният дисертационен труд, който е фокусиран върху ограниченията на използвания в системите за бизнес анализ многомерният модел на данните и по-специално върху явлението разреденост на данните при многомерен анализ.
2. Общо описание на представените материали
Обемът на дисертацията е 145 страници и включва увод, 5 глави, заключение, списък на цитираната литература и 3 приложения (24 стр.). Използваната литература включва 97 заглавия, от които 5 на български език, останалите на английски език. Авторефератът съответства на съдържанието на дисертационния труд. Представени са 5 публикации по темата на дисертационния труд - в Португалия, Румъния и 3 в България. От публикациите са цитирани.
3. Анализ на научните и научно-приложните постижения в дисертационния труд
Първа глава има обзорно-аналитичен характер – в нея са разгледани основните характеристики на многомерния модел на данни и е извършен анализ на ограниченията на модела. Описана е неговата роля в процеса на откриване на знания. Посочени са налични алтернативи на многомерния модел в системите за анализ. Анализирани са явленията разреденост на данните и експлозия на данните, както и предимствата и недостатъците на различни архитектурни подходи.
Във втора глава докторантката е извършила аналитичен обзор на използваните методи за ефективно съхранение и извличане на данни в аналитичните системи. Представени са най-разпространените техники за ефективно физическо съхранение на данните като композитно индексиране при съхранение на данните в многомерен формат, техники за компресиране на данните, разделяне на дялове, моделиране на кубове с по-малка размерност. Анализирани са налични методи за намаляване на времето на отговор в аналитичните системи – пре-агрегации и материализация на сечения от куба, индексиране при релационно и многомерно съхранение на данните.
В трета глава са анализирани някои връзки между стойности на измерения, пораждащи разреденост в многомерния модел и са посочени съществуващите класификации на видовете разреденост. Разгледани са най-разпространените техники за ефективно физическо съхранение на данните, като композитно индексиране при съхранение на данните в многомерен формат, техники за компресиране на данните, разделяне на дялове, моделиране на кубове с по-малка размерност. Анализирани са налични методи за намаляване на времето на отговор в аналитичните системи - пре-агрегации и материализация на сечения от куба, индексиране при релационно и многомерно съхранение на данните. Предложена е нова класификация на разредеността в многомерен куб - съдържа по-малък брой категории в сравнение с някои от съществуващите класификации и е базирана на семантиката на разредеността в даден куб, а не на разпределението на празните области в куба.
В четвърта глава е предложен нов оригинален обект като разширение на многомерния модел на данните – карта на регулярна разредност; изследвана е приложимостта на обекта за подобряване на качеството на данните, на ефективното им извличане, съхранение и интерпретацията им; предложен е метод за откриване на области с регулярната разреденост в n-мерен куб; предложено е представяне на карта на регулярната разреденост като съвкупност от бизнес правила; предложен е метод за отстраняване на повторения на данни в адитивни йерархични участъци на неадитивни показатели.
В пета глава са представени постигнатите експериментални резултати по отношение на метода на отстраняване на повторения на данни в адитивни йерархични участъци на неадитивни показатели. Експериментът е извършен като доказателство на разработената от докторантката концепцията върху данни от реален склад от данни. Въз основа на подхода, описан в трета глава с използване на структури и данни от реално работеща система, е извършен сравнителен анализ на заеманата памет и бързодействието при елиминирането на връзки от тип ирелевантност и сегментация на измерения. Показана е ефективността от прилагането на подхода на сливане на измерения, като при избора на измерения за конкатениране е взет под внимание и коефициентът на разреденост на данните.
За извършване на експериментите към редактор за създаване на регулярна разредност са разработени две функционалности, свързани с приложимостта на карта на регулярна разреденост: модул за откриване за на некоректни данни в куб и модул за автоматична селекция на релевантните дименсионни елементи.
Дисертационният труд е оформен добре, като за всяка глава са изведени конкретно решаваните задачи и са формулирани приносите. Получените резултати от извършената експериментална работа показва приложимостта на разработката.
Посочените в дисертационния труд перспективи за бъдещо развитие разработката показва не само желанието, но и възможностите на докторантката да продължи да работи в тази област.
Всичко това ми дава основание да твърдя, че докторантката е постигнала целта на дисертацията, като е решила коректно поставените научни задачи и е получила необходимите научни и научно-приложни резултати.
4. Критични бележки и препоръки
- Би било добре литературните източници да обхващат и по-голям брой публикации на български автори;
- Препоръчвам на автора, да продължи да работи в тази област и да потърси конкретна практическа реализация на постигнатите резултати.
Заключение
По моя преценка Ина Асенова Найденова е изграден научен работник, умеещ самостоятелно да формулира и решава научни задачи. Представеният дисертационният труд е оформен съгласно изискванията на Правилника за придобиване на научни степени в Софийския университет „Св. Климент Охридски”. Авторефератът съответства на съдържанието на дисертационния труд. Считам, че докторантката е изпълнила поставените задачи и представеният труд има необходимите качества и отговаря на всички нормативни изисквания на ЗРАС на РБ, ППЗРАС на РБ, ПУРПНСЗАД на СУ и ПУРПНСЗАД на ФМИ при СУ за присъждане на образователната и научна степен „доктор”
Поради това предлагам убедено на почитаемите членове на научното жури, назначено със заповед № РД 38-436 от 02.10.2012 г. на Ректора на СУ, да присъди образователната и научна степен „доктор” на Ина Асенова Найденова в областта на висше образование: 4. Природни науки, математика и информатика, професионално направление: 4.6 Информатика и компютърни науки, научна специалност: 01.02.12 – Информатика
20 декември 2012 г. Изготвил становището:
гр. Варна (проф. д-р Никола Лютов)
Сподели с приятели: |