Становище от доц д-р Димитър Иванов Василев



Дата11.04.2018
Размер76.67 Kb.
#66780
Становище

от


доц. д-р Димитър Иванов Василев

ръководител група "Биоинформатика"

при АгроБиоИнститут

бул. "Драган Цанков" №8, София 1164

относно

дисертационния труд



на

Валерия Николаева Симеонова
МЕТОДИ НА SOFT-COMPUTING В ИЗЧИСЛИТЕЛНАТА БИОЛОГИЯ: АСЕМБЛИРАНЕ НА ДАННИ ОТ ГЕНОМНО СЕКВЕНИРАНЕ
представен за придобиване на образователна и научна степен "Доктор"

по направление 4.6 "Информатика и компютърни науки",

научна специалност 01.01.12 "Информатика"

Със заповед № 0038-59/05.02.2014 на Ректора на Софийски Университет "Св. Климент Охридски", проф. дин Иван Илчев съм утвърден за член на Научно жури по процедура за придобиване на образователната и научна степен Доктор от Валерия Николаева Симеонова въз основа на представения от нея дисертационен труд "Методи на soft-computing в изчислителната биология: асемблиране на данни от геномно секвениране".

В качеството си на член на научното жури на първото му заседание ми бяха предоставени: дисератцията и автореферата по нея - в напечатан и подвързан вид, професионалната биография на дисертанта, както и копия от публикациите, свързани с дисертацията за написване на становище.

Настоящето становище е съобразено с изискванията на закона за развитие на академичния състав в Република България (ЗРАСРБ), Правилника за неговото прилагане (ППЗ), както и Правилника за условията и реда за придобиване на научни степени и за заемане на академични длъжности във Факултета по Математика и Информатика (ФМИ) към Софийския Университет "Св. Килмент Охридски".

Представеният дисертационен труд е съобразен с основните изисквания според ЗРАСРБ, ППЗ и правилника на ФМИ, като се състои от увод (глава 1), три глави, заключение (глава 5), библиография, списък на авторските публикации по дисертационния труд, списък на фигурите и списък на таблиците в дисертацията.

Като актуалност на проблема, смисъл и изпълнение на поставените цели и задачи дисертационната работа на Валерия Симеонова има несъмнена стойност, заключаваща се представянето на нови знания от областта на изчислителната биология, свързани с използването на in silico методи за асемблиране на фрагменти получени от геномно секвениране ново поколение. Анализът на данни от такъв вид секвениране във всичките си измерения, като откриване и корекция на грешки, асемблиране, картиране или съпоставяне на символни низове, претърсване на данни, съхраняване и визуализация е един нов и бързо развиващ се раздел на биоинформатиката придобил огромно значение в последните 5 години, когато тези технологии заеха основното по значение приложение в геномните изследвания в медицината, екологията, фармакологията, земеделието, и почти всички науки за живота и Земята. Същественият принос в развитието на тези технологии се дължи на генерирането на огромно количество данни, което трябва да се анализира, съхранява и визуализира единствено с помощта на компютърните науки и технологии. В тази връзка имено, представеният дисертационен труд се се явява и като едно предложение за решение на определен кръг от тези проблеми в контекста на изпозлването от софт-компютинга на различни методи и алгоритми за гъвкав анализ на информацията от пралелното геномно секвениране.

Дисертацията е написана на 161. стр, състои се от 5 глави с увод и заключение, съдържа 32 фигури и 21 таблици. Има списък на изпозлваните съкращения и един кратък, но съдържателен речник на изпозлваната терминология, която е преведена добре. Прави добро впечатление и използваната литература. Оформянето на работата е с определени естетически качества.

Представените в глава първа актуалност на проблема, цели и задачи на дисертационният труд подчератват значението и същевременно предлагат своеобразна интерпретация на основните понятия в схемата на разрабованите проблеми: имено обединяване на различни методи и алгоритми от областта на статистиката, теория на алгоритмите, анализ на големи по обем масиви от данни. Основната задача на работата за оптимално асемблиране на геном, за който по принцип съществува референтен списък от символни низове е представена подходящо. Разбира се, зависимостта на спецификата на работата от вида данни, както и от смисъла на софт-компютинга като една виртуална последователност на задачите и етапите на анализ създава известна представа за неоптимален баланс на представянето им, но това не омаловажава постановката и смисъла на цялата работа. Тук особено добре проличават и добрите познания на докторанта, както от страна на специфичните алгоритмични проблеми на решаването на поставените задачи, так и до голяма степен от страна биологичния характер на данните и смисъла на работата в контекста на основна и важна област област от изчислителаната биология като асемблирането на данни от паралелно секвениране.

Това добре личи и от представения литературен преглед в глава 2 на дисертационният труд, където са коментирани публикации от от последните 10 години, с особена актуалност на проблемите свързани с асемблирането на данни от паралелно секвениране от последните пет години. Това отново подчертава актуалността и съвременното значение на разглежданите в дисертацията проблеми и предложените за тази цел решения от дисертанта. Своеобразното структуриране на методите в глава втора и тяхното обсъждане биха изглеждали много по-пълноценно, ако дисертантката бе съумяла да представи една обзорна публикация с критичен анализ на съществуващите разработки като алгоритмични решения и приложен софтуер специфични за асемблирането на данни от паралелно секвениране.

Глава втора на дисертацията освен това представя и някои виждания на дисертанта за развитие и приложение на тези методи, което представлява интересен профил на оползотворяване на познанията й за самостоятелна работа, както и една предпоставка за следващата глава, където са изложни нейните творчески и методологични идеи, свързани с реализация на основните задачи, поставени в дисертационния труд.

Обособената в глава трета методика за провеждане на изследването съобразно поставените цели и задачи представляват главните достойнства на предложения за защита труд. В този предложен комплекс от методи и алгоритми е отразена реализацията на главните идеи на дисертанта, а имено: алгоритъм за намаляване на шума или по-скоро за отстраняване на грешките, в случаи на непълнота на информацията, статистическо профилиране на грешките, изпозлване на невронна мрежа на базата на това профилиране с цел по-точно понижаване на фоновия шум, алгоритм или по-скоро алгоритмични разработки за асемблиране основани на мрежи от изкуствени референтни прочити-идентификатори (МИРПИ) – като основен граф за асемблиране, методи за генериране на консенсусни секвенции съобразно референтния геном съдържащи набор от процедури за откриване на припокриващите се региони, както и методи за оптимизация на отделните процедури (като например пътища в графа на асемблирането) и валидация на получените резултати.

Отделните части на този конвейр (или пайплайн) от процедури е реализиран в различни софтуерни среди, като Visual Basic за парсване на данните, R project за всички статистически анализи и визуализации, bash скриптове на Linux, специализиран софтуер за работа с невронни мрежи и др. Това от една страна показва уменията на докторантката за разбота с различен софтуер, както и подчертава основното значение на софт-компютинга като среда за обединяване на различни алгоритми и софтуерни програми, с цел постигане на определна крайна цел. Като разработени модели на изследване предложеното от Валерия Симеонова представлява определен интерес и има научен принос, което е отразено и в нейните публикации. По-важното е, че всичко това е постигнато в резултат на самостоятелна работа. Естествено в представянето в текста и до известна степен в консеквентността на глава 3 има какво да се желае от гледна точка на баланс и по-дефинитвно описание на целя комплекс на методики, но това не намалява стойността на представената работа в глава 3.

Обсъждането и реализацията на методите и алгоритмите, преложени в галва 3 са отразени в глава 4 от дисертационния труд. Глава 4 е посветена на приложението на разработените алгоритми и на валидацията им. Основна роля, заемат генерирането на мрежите от реферативни прочити-идентификатори, съставянето на графа за асемблиране на прочитите от секвенирането, и най-важното валидацията на изпозлваните и разработени решения и алгоритми в този софт-компютинг конвейр. В тази глава би могло да се отдели повече внимание на дискусията на получените резултати, както като следствие от конкретната работа, така и като сравнение с други публикувани изследвания. Това би подчертало до голяма степен конкретните приноси на представената за защита дисертационна работа.

В галва 5 са дискутирани резултатите и са представени основните приноси на дисертационния труд и насоки за бъдеща работа. Так представените приноси до голяма степен кореспондират с поставените цел и задачи на работата и са безусловно верни. Старанието, приносите да бъдат изложени в по-консистентен вид създава представа за небалансираност на фразите, за което може би търпят известна редакция. Но от смислова гледна точка приносите са добре разделени, подчертано е самостоятелното ниво на количество и качество на работата, както и опрделената й оригиналност.

Публикациите по дисертацията са в съответствие с изискванията за дисертационен труд. Има представени 7 публикации, две в списания с импакт фактор както и в сборници с конференции. Все още няма цитирания по публикациите.

Докторантката е участвала в няколко конференции и научни проекти, финансирани както от ФНИ у нас, така и по програми на ЕС.

Авторефератът отразява съдържанието на дисертацията и е представен в съответствие с изискванията.

Освен изброените в текста критики на така представения дисертационен труд биха могли да се формулират още няколко:

- не е намерен добър баланс между изпозлване на чуждици и български думи и изрази. Това е общ проблем при оформяне на научни трудове у нас, но все пак би трябвало да се търси опредлена златна среда;

- би могло още по добре да се обясни изпозлването на имено представения в дисертацията референтен геном;

- някои използвани алтернативни наименования и дефиниции за методи и алгоритми не са точни и могат да предзивикат двусмислие;

- има възможност за по-оптимално оформяне на задачите и композирането им с приносите на работата. Това е важен параметър при оценката на един дисертационен труд.


В качеството си и на втори научен ръководител на докторант Валерия Симеонова бих искал да подчертая нейното старание да се занимава с решаването на определни научни проблеми в една много нова област като биоинформатика за анализ на данни от паралелно геномно секвениране, както и любознателността й, силно подчертаната самостоятелност и умението да комуникира с други докторанти и партньори по различни проекти. Определено е нейното желанието и в бъдеще да продължи научната си работа по тези и сходни проблеми.

Като обобщаващ коментар на представената работа може да се каже ad hoc за очевидната самостоятелност и определена оригиналност на работата, достатъчния обем и задълбоченост на изследванията. Работата и свързаните с нея публикации имат научно и практическо значение. Считам, че докторант Валерия Симеонова е изпълнила в представения за получаване на научната и образователна степен „доктор” труд всички изсквания на Закона за развитие на академичния състав (ЗРАСРБ). Правилника за неговото прилагане (ППЗ) и Правилника за условията и реда за придобиване на научни степени и заемане на академични длъжности във ФМИ на СУ.

Това безусловно ми дава основание за даване на положителна оценка, предлагайки на уважаемото научно жури да присъди на Валерия Николаева Симеонова образователната и научна степен „доктор“ по специалност 4.6 „Информатика и компютърни науки“.

21.04.2014.



София
доц. д-р Димитър Иванов Василев


Каталог: index.php -> bul -> content -> download
download -> Литература на народите на Европа, Азия, Африка, Америка и Австралия
download -> Дипломна работа за придобиване на образователно-квалификационна степен " "
download -> Рентгенографски и други изследвания на полиестери, техни смеси и желатин’’ за получаване на научната степен „Доктор на науките”
download -> Св. Климент Охридски
download -> Акад. Илчо иванов димитров (1931 – 2002) фонд 20 опис 1
download -> Азбучен списък на преподавателите
download -> Климент охридски” университетски архив
download -> График за провеждане на семтемврийската (поправителна) изпитна сесия на магистърска програма „политическа социология учебна 2014/2015 г. Поправителна сесия от 24 август до 11 септември 2015 г
download -> Обявява прием на студенти


Сподели с приятели:




©obuch.info 2024
отнасят до администрацията

    Начална страница