Microsoft Word Master thesis of Petar Kormushev in Medical Informatics doc



Pdf просмотр
страница10/41
Дата17.04.2022
Размер2.9 Mb.
#114126
ТипДиплом
1   ...   6   7   8   9   10   11   12   13   ...   41
Kormushev MSc thesis Bio 2006
Свързани:
1601561030 Dobrinka Bogdanova
1.7. Цел на дипломната работа
След като представихме накратко целта и методите за ИЗД, описахме основните операции по конструиране и визуализиране на извадки, вече можем по-точно да дефинираме целта на настоящата дипломна работа:
Целта на дипломната работа е проектиране и създаване на софтуерна система, която е съставена от два отделни инструмента:
1. „Конструктор на извадки”, с чиято помощ един лекар да може лесно да конструира извадки от големи медицински бази от данни по дефиниран от него критерий. Тези извадки представляват многомерни, класифицирани медицински данни с подходящо описание (мета-данни). Конструирането трябва да притежава интерактивни свойства, които да позволяват намаляване обема да данните чрез задаване на критерий за избор на подходящи обекти и техните атрибути.
2. „Визуализатор на извадки”, с чиято помощ така конструираните извадки да могат да се визуализират в двумерно пространство чрез намаляване размерността на данните по FastMap алгоритъм. Визуализацията трябва да притежава интерактивни свойства, които да позволяват лесното разглеждане на данните, стоящи зад отделните елементи от визуализацията.
Целта на дипломната работа е постигната, като са проектирани и разработени две програми: Konstruktor и Vizualizator, които изпълняват функционалните изисквания към двата инструмента.


14
2. Проектиране на Конструктора
Конструкторът на извадки трябва да позволява на всеки лекар лесно да конструира извадки от големи медицински бази от данни. При това лекарят трябва да може сам да дефинира критерии, на които иска да отговарят обектите в получената извадка. В тази глава ще разгледаме структурата на големите бази от данни и ще проектираме начин, по който интерактивно да могат да се конструират извадки от тях.
2.1. Организация на данни и бази от данни
Една от характеристиките, която отличава извличането на закономерности от данни от други типове аналитични задачи, е количеството на данните. В много от ИЗД приложенията матрицата от данни съдържа милиони редове и хиляди колони. По тази причина въпросите за ефективността на алгоритмите за обработка на данните са от много съществено значение. Един алгоритъм, чието време за изпълнение нараства експоненциално с нарастването на броя n на редовете, може да бъде неизползваем за всички практически случаи, освен за много малки множества от данни.
Във всеки ИЗД проект е полезно да се прави разграничение между две фази. По време на първата се подготвят данните за ИЗД алгоритъма, а по време на втората се изпълнява самият алгоритъм. Първата фаза изглежда тривиална, обаче често точно тя се оказва “тясното място” в проекта. Например, при анализа на данни често е необходимо избраният ИЗД алгоритъм да бъде прилаган многократно към различни подмножества от данните. Това означава, че ние трябва да сме в състояние бързо да намираме членовете на всяко желано подмножество, както и да извличаме от базата и да зареждаме това подмножество в основната памет.
Целта на Конструктора на извадки е именно такъв инструмент, който да дава бърз и лесен начин за извличане на различни подмножества от данните.


Сподели с приятели:
1   ...   6   7   8   9   10   11   12   13   ...   41




©obuch.info 2024
отнасят до администрацията

    Начална страница