Издание на български език, софия 2020



Pdf просмотр
страница59/94
Дата14.12.2023
Размер5.62 Mb.
#119639
1   ...   55   56   57   58   59   60   61   62   ...   94
web ISBN 9786192450939
Свързани:
Tainite, metodyka BG FINAL, Продуктова оферта Цени на ниво 30.03-12.03.2023, Дисертация-Джумайов, 01-BE-Gerdj-KNU-old, 3 Skill-based-Approach practical-task V02, 341020 doi, 9.Managementul-relatiei-cu-clientii-BG, Motivate sales team Part (1), New Admin Culture part, Customer service Predpechat (1), lection-6, Management Part, Customer service Predpechat, d0bfd0bed181d180d0b5d189d0b0d0bdd0b5-d0bdd0b0-d0b3d0bed181d182d0b8-d0b2-d0bed180d0b3d0b0d0bdd0b8d0b7d0b0d186d0b8d18fd182d0b0
Обработени данни
Има няколко стъпки, свързани с обработката на набор от данни. Следващата диаграма представя възможна опция, при която най-напред данните се изследват, след това се избират и извличат, почистват се и се нормализират с помощта на инструменти като OpenRefine, описват се чрез контролирани речници и окончателно се обогатяват с помощта на техники като Named Entity Recognition и Linked data.
СЪЗДАВАНЕ НА ОБРАБОТЕН НАБОР ОТ ДАННИ
Широка гама от данни ползват резултатите от процеса на обработка, като например библиотечният каталог в следващия пример.
Изследване
+
Подбор
+
Извличане
Колекция на
организацията
Почистване
Описание
Обогатяване
Извличане
Трансформиране
Зареждане
Инструменти
Речник
Качество
Бази данни
Външни хранилища
Тагиране


120 121
КАК ДА СЪЗДАДЕМ GLAM ЛАБОРАТОРИЯ
Пример: Миграция на библиотечен каталог в RDA свързани,
отворени данни (LOD), Biblioteca Virtual Miguel de Cervantes
Каталогът на Виртуалната библиотека Miguel de Cervant-
es съдържа около 200 000 записа, първоначално създадени в
съответствие със стандарта MARC21. Библиотеката искаше
да направи достъпен каталога им чрез свързани отворени
данни. За да стане това, бе направен мапинг на съдържанието
на базата данни с помощта на автоматизирана процедура за
RDF тройки, които използват речника на RDA, за да опишат
субектите, както и техните свойства и взаимоотношения.
След това беше изграден специфичен онлайн интерфейс,
който да прави запитвания към така новосъздадената база
данни. След това данните са вече общодостъпни и лесно се
свързват с други приложения. (Candela et al., 2018)
Неподредени данни
Повечето лаборатории осигуряват достъп до данни без никаква обработка. След това потребителите могат да ги изследват и да решат как колекцията може да се впише в техните изследвания. Технологичните решения понякога могат да бъдат временни и данните, които са твърде неподредени за някои приложения, могат лесно да бъдат анализирани с други методи.Ако неподредените данни са неподходящи за конкретен изследователски проект, то тяхното почистване трябва да бъде включено в проекта при предлагането му. След това почистването може да се извърши от партньори по проекта, в сътрудничество с лабораторията или от общността на потребителите чрез платформа за краудсорсинг. Тези разходи и усилия, необходими за почистване на данните, следва да бъдат включени в проекта и не могат да бъдат извършени само от лабораторията.


Сподели с приятели:
1   ...   55   56   57   58   59   60   61   62   ...   94




©obuch.info 2024
отнасят до администрацията

    Начална страница