176 177
КАК ДА СЪЗДАДЕМ GLAM ЛАБОРАТОРИЯ
ФОРМÀТИ НА ДАННИТЕПри работа в лаборатория често се използват различни формати на данните. Приложеният списък в никакъв случай не е пълен, но прави преглед на възможните формати.
Снимки• Tagged Image File Format (TIFF)
• Joint Photographic Experts Group (JPEG 2000)
Текст• Analysed Layout and Text Object (ALTO) е
XML формат, описващ разпознат текст и оформление на изображения. Често се използва съвместно с METS (виж по-долу).
• Hypertext Optical Character Recognition (hOCR) е XML
формат, описващ разпознат текст и неговото местоположение върху изображение, използван от OCR програми с отворен код като Tesseract.
• Text Encoding Initiative (TEI) е XML формат, използван за кодиране на текст. Често се използва за цифрови издания.
Данни• Comma Separated Values (CSV) е формат, използван за представяне на таблични данни в стойности, разделени със запетая.
• JavaScript Object Notation (JSON) е формат, използван за предаване на данни по четим за човека начин.
• eXtensible Markup Language (XML) е
език за маркиране, подобен на HTML.
Сподели с приятели: