Microsoft Word Master thesis of Petar Kormushev in Medical Informatics doc



Pdf просмотр
страница22/41
Дата17.04.2022
Размер2.9 Mb.
#114126
ТипДиплом
1   ...   18   19   20   21   22   23   24   25   ...   41
Kormushev MSc thesis Bio 2006
Свързани:
1601561030 Dobrinka Bogdanova
    Навигация на страницата:
  • CDATA
2.7.1. Формат на мета-данните
Споменатите по-горе .names файлове представляват валиден XML [XML, 2005] с много проста структура. Главният (root) елемент е с име „metadata” и xml атрибутите му съдържат незадължителни глобални параметри:
• description – описание на базата в свободен текст
• separator – разделителя между стойностите на атрибутите
• class – името на атрибута, който да се счита за клас/клъстер
• missingValue – съмволът, който означава, че липсва стойност за даден атрибут.
Единствените допустими под-елементи на елемента „metadata” са с име „attribute” и всеки от тях съдържа в xml атрибутите си настройки на съответния атрибут:
• name – задължително име на атрибута
• type – задължителен тип (непрекъснат или номинален)
• domain – допустими стойности за номинален атрибут. Този параметър няма смисъл за непрекъснати атрибути. Ако не е задеден domain, няма ограничение за допустимите стойности и те ще бъдат извлечени при прочитането на данните.
Със задаване на domain, може да се постигне, както валидиране на данните, така и филтрирано прочитане, само на данни с определени сойности в съответния атрибут.
• skip – при стойност true, указва на програмата да не взима под внимание този атрибут.
• description – описание на атрибута в свободен текст
Формално, форматът на метаданните строго се подчинява на следната DTD схема (без да е необходимо да има експлицитно DOCTYPE обръщение към .dtd файл):
ELEMENT
metadata (attribute+)>
ATTLIST
metadata separator CDATA #REQUIRED


34 missingValue CDATA #IMPLIED description CDATA #IMPLIED class CDATA #IMPLIED
>
ELEMENT attribute EMPTY>
ATTLIST attribute name ID #REQUIRED type (nominal | continuous) "nominal" domain CDATA #IMPLIED description CDATA #IMPLIED missingValue CDATA #IMPLIED skip (true | false) "false"
>
Ето един пример за мета-данни, демонстриращ използването на всички предвидени атрибути в XML формата:
>
/>
/>

/>

/>
/>



35


Сподели с приятели:
1   ...   18   19   20   21   22   23   24   25   ...   41




©obuch.info 2024
отнасят до администрацията

    Начална страница