Курсова работа на тема Онлайн аналитична обработка на данни(olap) – същност и софтуерни решения Същност и проектиране на Бизнес интелигентни системи Съдържание



страница4/12
Дата03.01.2022
Размер0.69 Mb.
#112907
1   2   3   4   5   6   7   8   9   ...   12
onlaiin-analitichna-obrabotka-na-danni-olap
Същност на OLAP

OLAP е абревиатура на online analytical processing, което в буквален превод може да бъде преведено като – онлайн аналитична обработка. В процеса на развитие на обработката на данни, англоезичното понятие онлайн се допълва и изменя значението си. През първите години то е наблягало преди всичко на интерактивността в процеса на обработка, отколкото на присъствие в интернет, както сега се тълкува.

Възможностите на OLAP-технологията са съсредоточени най-вече в бързодействието, с което OLAP-алгоритмите анализират сложни потребителски заявки към определена база данни. Технологията намира своето все по-широко приложение в сферата на бизнеса. От възможностите на OLAP-технологията се възползват ръководители на дейности по продажби, маркетинг, управление, икономически анализ, одитиране.

През 70-те години на XX век има все повече системи за подпомагане на решенията (DSS – Decision Support System), но те са разнородни и нямат единни принципи и технология на работа. През 90-те години с развитието на мрежовите технологии за съхранение и пренос на данни и с навлизането на персоналните компютри DSS-системите се изменят от сървърно-ориентирани към решения от типа „клиент-сървър“.

През 1993 година Едгар Код (Edgar Codd), известен изследовател на бази данни и автор на релационни модели, предлага 12 критерии за съответствие на дадено приложение към технологията OLAP. През 1995 година на базата на тези изисквания е формулиран така наречения тест FASMI (Fast Analysis of Shared Multidimensional Information), който включва следните изисквания към приложения за многомерен анализ:


  • представяне на резултатите от анализа за приемливо време (обикновено за такова се приема 5 секунди);

  • възможност за осъществяване на всякакъв логически и статистически анализ, характерен за даденото приложение и съхранение на анализа във вид, достъпен за крайния потребител;

  • възможност за едновременен достъп на много потребители до базата данни и реализиране на система за обработка на колизии (конфликти, неточности) при едновременен достъп и оторизиране на потребителите;

  • концепция за многомерно представяне на данните, включваща и пълна поддръжка на йерархични и множествени йерархични бази данни; това е ключова изискване на OLAP-технологията;

  • възможност за достъп до всякаква необходима информация независимо от нейния обем и място на съхранение.

В контекста на FASMI-критериите можем да допълним определението за OLAP-приложение: OLAP-приложението е система за бърз достъп на много потребители към многомерно пространство от аналитични данни, която генерира числов и статистически анализ.

Важно е да отбележим, че OLAP-функционалност може да бъде реализирана с различни средства и способи, а не с някакви конкретни и задължителни реализации. OLAP може да бъде изградена с разнообразен набор от инструменти, започвайки с най-елементарните средства за анализ на данни - офис-приложенията и завършвайки с многопроцесорни аналитични системи, базирани на сървърни продукти.



С течение на времето организациите натрупват огромни количества данни от техните транзакционни системи. Обемът на тази информация затруднява процеса на съхранение и достъпа до нея и ограничава възможностите за ефективното й използване. Това налага данните да бъдат организирани в друг вид структури – хранилища на данни или складове от данни (Data Warehouses - DW). Те предоставят инструменти за систематично организиране, визуализиране и анализиране на данни, събирани от различни системи в продължителен период от време. По тази причина системите, които се изграждат върху складовете от данни, се наричат аналитични системи – OLAP systems. OLAP системите позволяват бърз, интерактивен и съгласуван достъп до обобщено представяне на информацията с възможности за динамичен, многомерен анализ по различни показатели – време, място, тип дейности и др. Тези данни могат да дадат важна за бизнеса информация. Например, какви са били параметрите на продажбите през последните няколко години; как са се променяли цените в определен период от време или географски регион. Всеки от двата типа системи - транзакционни и аналитични, поддържа важни функции при обработката на информация. Основната цел на една транзакционна система е да осигури бързодействие при получаване на справките, както и ефективност и гъвкавост при съхранение и обновяване на ежедневно променящата се информация. При складовете от данни ударението е върху съхранението на значителни количества данни във вид, удобен за различни анализи - статистики, сравнения на данни от предишни години, обобщения по различни параметри. Тази информация има за цел да отговори на различни въпроси, свързани с текущото и миналото състояние на някакъв тип бизнес, както и да даде потенциални насоки за неговото развитие. Традиционните системи поддържат онлайн обработка на транзакции (OLTP), която включва добавяне, изтриване и обновяване на данни, както и отговор на различни запитвания, относно съдържанието на данните - заявки. Организацията на базите от данни в тях трябва да бъде оптимизирана по отношение на този тип операции. В някои случаи заявките засягат само една малка част от базата от данни или се извършват операции, с които се актуализират няколко записа във връзка с един транзакционен процес. Моделите, които съответстват на този тип операции, са се развивали в продължение на няколко десетилетия и включват последователно йерархични, мрежови, релационни, обектно-релационни или изцяло обектно-ориентирани модели. Организирани по начин, целящ оптимално представяне на отделните елементи и връзките между тях, тези модели на бази от данни не са подходящи за аналитични заявки. Необходими са решения, които позволяват обобщаване на огромни количества детайлни данни и използване на различни модели на представяне на информацията в аналитичните системи. При складовете от данни се изисква тематично-ориентиран модел, удобен за интерактивен анализ на данните. Те трябва да бъдат проектирани така, че да осигуряват ефективно извличане, обработка и визуализация на данните за аналитични цели и вземане на решения. Затова тук се използва специфичен многомерен модел, който не само съхранява данните, но и позволява тяхното категоризирне на базата на предварително дефинирани критерии (измерения) – например, време, географско положение и др. За целта данните се разглеждат като един куб в n-мерното пространство. Кубът се дефинира чрез измеренията и факти за измеренията. Така се постига възможността данните да бъдат анализирани по различни измерения. В сравнение с транзакционните системи, складовете на данни обикновено съдържат данни, чиито количества са в пъти по-големи. В допълнение, те са събирани от множество източници, които могат да включват бази от данни с различни модели и структури на данните, а понякога и файлове от външни системи и платформи. Това също слага отпечатък върху тяхната структура и поставя редица въпроси, свързани с обединението на данните от различните източници. От различната функционална насоченост на двата вида системи - транзакционни и аналитични, следва и прилагането на различни модели на представяне на данните в тези системи и различни проектни решения.





  1. Сподели с приятели:
1   2   3   4   5   6   7   8   9   ...   12




©obuch.info 2024
отнасят до администрацията

    Начална страница