Microsoft Word Master thesis of Petar Kormushev in Medical Informatics docPdf просмотр
страница1/41
Дата17.04.2022
Размер2.9 Mb.
#114126
ТипДиплом
  1   2   3   4   5   6   7   8   9   ...   41
Kormushev MSc thesis Bio 2006
Свързани:
1601561030 Dobrinka Bogdanova


Софийски Университет “Св. Климент Охридски”
Факултет по Математика и Информатика
Катедра “Информационни технологии”
Специализация „Био- и медицинска информатика”

ДИПЛОМНА РАБОТА

Тема
:
Визуален подход за извличане на закономерности от бази от данни с медицинска информация чрез използване на FastMap алгоритъм
Дипломант
: Петър Стефанов Кормушев, Ф№ М-21546
Научен ръководител: доц. д-р Антоний Попов
ФМИ
, СУ “Св. Климент Охридски”
Март 2006 г.
София


2
“Data is not information, Information is not knowledge, Knowledge is not understanding, Understanding is not wisdom.”
Cliff Stoll & Gary Schubert
“Данните не са информация, Информацията не е знание, Знанието не е разбиране, Разбирането не е Мъдрост.”
Клиф Стол & Гари Шуберт


3
Резюме
Бързият прогрес в развитието на средства за придобиване и съхраняване на информация доведе до натрупването на големи медицински бази от данни. Това огромно количество събрани данни значително превишава възможностите на човек те да бъдат ефективно използвани без помощта на специализирани мощни средства за анализ. Като резултат, данните, събрани в огромните бази, са се превърнали в
“гробници от архиви”, които почти не са посещавани от никого. Така се стига до ситуация, описвана като “богата на данни, но бедна на информация” [Агре, 2003].
За запълване на тази все по-разширяваща се пропаст между данните и информацията се прилагат различни подходи от научната дисциплина “Извличане на закономерности от данни“ (Data Mining), която цели да превърне тези гробниците в “златни мини”, от които се добиват знания. Извличането на закономерности от данни (ИЗД) се състои в анализ на (често много големи) множества от наблюдавани данни с цел да бъдат открити в тях неочаквани зависимости или те да бъдат обобщени и представени по нови начини, които са разбираеми и полезни за притежателите им. Един от възможните подходи за откриване на зависимости е визуалният, при който данните се подлагат на обработка и се визуализират по някакъв обобщен начин, позволяващ анализирането им от експерти в областта.
Целта на настоящата дипломна работа е проектиране и създаване на софтуерна система за визуализация на многомерни, класифицирани медицински данни. Това се постига чрез прилагане на FastMap алгоритъм за намаляване размерността на данните, така че да стане възможно тяхното двумерно визуализиране. Софтуерната система е разделена на два отделни инструмента, които ще наричаме „Конструктор” и „Визуализатор”, като изборът на тези имена ще стане ясен в хода на изложението.
Изложението е разделено на четири големи глави. В първа глава се прави въведение в предметната област и се дефинира по-точно целта на дипломната работа. Във втора глава се прави анализ на изискванията за създаване на извадки от големи бази от данни и се проектира инструментът „Конструктор”. В трета глава се прави описание на алгоритъма FastMap за намаляване размерността на данни и се проектира инструментът
„Визуализатор”. В четвърта глава се описва конкретната реализация на двата инструмента както на ниво потребителски интерфейс, така и на ниво вътрешна реализация. Изложението завършва с обобщение и насоки за бъдещо развитие.


4
Благодарности
Бих искал да изразя своите благодарности към моя научен ръководител доц. д-р Антоний Попов, който направи всичко възможно, за да успея да защитя тази дипломна работа във възможно най-кратки срокове.
Специални благодарности дължа на моя колега и най-добър приятел Иван Дилов, без който създаването на „Визуализатора” нямаше да е възможно в настоящия му вид.
Признателен съм на хилядите абонати на медицински софтуер „Хипократ” [Хипократ,
2006] за отправените предложения, критики и препоръки за подобряване на
„Конструктора”. Програмният продукт „Хипократ” е един от най-разпространените медицински продукти в България, с който ежедневно работят над 2000 общопрактикуващи лекари и специалисти от цялата страна. Инструментът
„Конструктор” от настоящата дипломна работа успешно беше интегриран като допълнителен модул към „Хипократ” и вече повече от 1 година потребителите на програмата го използват за създаване на гъвкави извадки от своите бази с медицински данни.
Също така, бих искал да благодаря на „Диагностично-Консултативен Център” (ДКЦ-2) в Плевен – един от най-големите медицински центрове в България, където също работят с програма „Хипократ” – за предоставените бази с медицинска информация. Те бяха изключително полезни за тестването на двата инструмента и допълнителното им оптимизиране за работа с огромни по обем данни.


5


Сподели с приятели:
  1   2   3   4   5   6   7   8   9   ...   41
©obuch.info 2024
отнасят до администрацията

    Начална страница