Курсова работа на тема Онлайн аналитична обработка на данни(olap) – същност и софтуерни решения Същност и проектиране на Бизнес интелигентни системи Съдържание



страница5/12
Дата03.01.2022
Размер0.69 Mb.
#112907
1   2   3   4   5   6   7   8   9   ...   12
onlaiin-analitichna-obrabotka-na-danni-olap
Видове OLAP системи

От гледна точка на архитектурното решение, за многомерния модел съществуват два основни типа – многомерен OLAP (MOLAP) и релационен OLAP (ROLAP). Третият тип - хибридният OLAP (HOLAP) е комбинация на двете технологии. И трите вида OLAP-технологии, разгледани в са многомерни. Това тяхно свойство може да бъде разглеждано в три аспекта:



  • многомерност при представяне на данните – този компонент осигурява възможност за реализиране на многомерна виртуализация и техника за различни манипулации с данните;

  • многомерна обработка – в основата й е език за програмиране с възможност за формулиране на многомерни заявки;

  • многомерност при съхранение – осигурява пълен набор от средства за физическо разместване на данните в базата.

•Релационната OLAP (ROLAP) архитектура се предпочита, когато данните се вземат от RDBMS или оперативните системи съхраняват своите данни в RDBMS. Данните се съхраняват в схема от вид „звезда” или схема от вид „снежинка”. Фактите и D-структурите са представени като таблици и при този начин на представяне се губи част от многомерната семантика и семантичната разлика между двете понятия. Друг проблем, който е обсъждан подробно, е дали за D-структури трябва да се създават образи по нормализиран или денормализиран начин. Противоположно на MOLAP системите, които използват структури на съхраняване специално проектирани за обработка и анализ на многомерни модели, релационните OLAP системи разчитат на утвърдените и традиционите техники на релационни база данни. Новаторският подход се проявава в ROLAP машината осъществявайки трансформиране от заявка към многомерен модел до заявка към модел от релационен вид. За целите на допълнително научно изследване важни са и следните проблеми: откриването на най-ефективното представяне на заявки; балансиране на динамичното натоварване между RDBMS и ROLAP машината. За всяко входящо запитване ROLAP машината трябва да избира представяне, което е оптимално с оглед на дадени критерии (например производителност на заявката). Изчислителни операции свързани с многомерни структури не се изпълняват добре от релационни инструменти. Заявка към многомерен модел не може да бъде лесно изразена използвайки SQL, което е предпоставка за създаване на нови програмни езици. ROLAP машината трябва сама да осъществи съответните операции, използвайки многомерни структури на данни. Балансирането на натоварването между сървъра на базата данни и ROLAP машината е резултат от стратегията използвана за избиране на оптимална заявка, което е важен отличителен критерии за съществуващите продукти. Оценяването на многомерните (MD) операции в ROLAP машината може да съкрати времето за обработка на дадено запитване и да намали общата способност за изчисление на системата, като ROLAP машината се превърне във вход за архитектурата на системата.

Сървърът е често използвано място за извършване на изчисления на многомерни модели в OLAP приложенията клиент/сървър и се използва при много продукти. Производителността е добра, тъй като машината и базата данни могат да бъдат оптимизирани да работят заедно и наличността на голям обем памет на сървъра позволява да се извършват ефективно мащабни изчисления на масиви от данни. Стъпвайки на предположението, че повечето потребители разполагат със сравнително мощни персонални компютри, много доставчици на продукти използват предимствата на тази мощност за извършване на изчисления и анализ на многомерни модели. При нарастването на популярността на т. нар. „тънки клиенти” (клиент/сървър архитектура – мрежов компютър без твърд диск), доставчиците на продукти с тази архитектура трябва да се ориентират повече от обработката базирана на клиент към новите сървъри за Web приложения. Познаването на различните софтуерни продукти и съответните архитектури е важно при оценка на изпълнението, капацитета, функционалността и в частност върху мащабa на едно OLAP решение. Поради постоянно увеличаващите се потребности на бизнеса, техническите разработки в областта на OLAP са силно пазарно ориентирани. Съществуващите софтуерни инструменти представляват съвременното равнище на внедрените в практиката технологии. Изследователските проблеми свързани с OLAP привличат необходимото внимание, но не е достатъчно в сравнение с пазарния успех на OLAP продуктите. Високите цени на софтуерните продукти и изискванията за мощен хардуер поставят “на колене” всеки изследователски порив, а от друга страна българските софтуерни разработчици са заети да разработват софтуерни приложения за международни организации и не остава време за научни публикации. С цел постигане на конкурентни резултати е необходимо по-тясно сътрудничество между българския бизнес и научните институти и стартиране на съвместни научно- индустриални проекти.


• При MOLAP данните се съхраняват в многоразмерен куб, който е оптимизиран за сложни изчисления и поддържа висока производителност. Методът работи с големи обеми памет, необходима за съхранението на всички възможни комбинации по измеренията и техните обобщения и изисква значително време за първоначалното зареждане и изчисления.

MOLAP предварително събира данните, което го прави бърз. Следващото поколение технология, която се използва при бизнес анализите е под формата на т.нар multidimensional online analytical processing (MOLAP), известна също като OLAP базирана на кубове. Основната разлика между ROLAP и MOLAP е във факта, че при MOLAP резултатите от заявките се събират предварително, докато при ROLAP това се случва само, когато те са нужни. Този подход осигурява почти незабавен достъп до събраните резултати, стига потребителя да е задал правилния бизнес въпрос, който предполага отговор от съответните параметри. И тъй като събраните данни биват предварително пресмятани, MOLAP може да бъде по-бърз от ROLAP. Само че тази бързина идва с цената на загуба на гъвкавостта. И отново, понеже MOLAP е базиран на заявки, то също така няма възможност да запазва асоциациите.

Най-често активните данни се съхраняват в многомерна структура на даден сървър и включва данни, извлечени и обобщени от външни системи или от крайни потребители. В повечето случаи, базата данни се съхранява върху диск или се използват RAM базирани структури с цел по-бързо изпълнение. Агрегирани и други изчислителни операции могат да бъдат предварително извършени и резултатите да бъдат съхранени във форма на масив от данни. Физическото съхраняване и мястото на обработка на данни е от изключително значение в системите за управление на многомерните бази данни (MDDBMS), тъй като влияе върху изпълнението, изискванията за памет и следователно върху максималния обем на данните.



• HOLAP използва MOLAP за справки и агрегации на високо ниво, а при преглед на детайлите се правят заявки към релационна ROLAP схема. Хибридната OLAP (HOLAP) архитектура може да бъде дефинирана като система, която поддържа и интегрира многомерно и релационно съхраняване на данни по еквивалентен начин, с цел да бъде извлечена полза от предимствата на двете технологии - MOLAP и ROLAP. Хибридният OLAP подход позволява на разработчика на приложението да избира комбинация между ROLAP и MOLAP архитектури, базирани на изискванията за отчети на потребителя, наличните системни ресурси и вида на данните. Например, D-структурите Клиент и Продукт понякога са проблематични в една MOLAP архитектура поради тяхната висока детайлност на данните. В HOLAP архитектурата, те могат да бъдат съхранявани в ROLAP схема, докато всички други D-структури са съхранявани в една по-лесно управляема MOLAP архитектура. В допълнение към гъвкавостта да се съхраняват данните в различни основни архитектури, SAS HOLAP архитектурата позволява всяко парче от модела да бъде съхранявано на отделна изчислителна платформа. Разработчикът на софтуерното приложение трябва да избере измежду няколко възможности относно не само какви под-таблици да съхранява в OLAP базата данни, но и как физически да съхранява данните. Всеки набор от възможности има допуснати компромиси и е задължително разработчикът да разбира характеристиките на данните, които са заложени в модела, и как крайните потребители ще използват многомерния модел. Оценката на данните и на бизнес изискванията е важна стъпка в процеса на проектиране на приложението.

Особен вариант на ROLAP се явяват т.нар. R-ROLAP (Real-time ROLAP), които работят в реално време. За разлика от ROLAP в R-ROLAP не се създават допълнителни таблици за съхранение на критериите (параметрите), а те се разчитат/анализират по време на формулиране и изпълнение на заявката. При това всяка многомерна заявка към OLAP-системата се преобразува автоматично в SQL-заявка към релационната база данни.

Различните начини на съхранения на информацията има свои предимства, като няма единно становище на анализатори и потребители. MOLAP е най-удачен за неголям набор от данни, той бързо разчита критериите по куба и връща отговор, но при това се генерира огромен обед данни. ROLAP се оценява като по-мащабно решение, използващо възможно по-малко пространство, но скоростта на обработка значително намалява. HOLAP е съчетание на тези два подхода, достатъчно добре се мащабира (работи с различен обем данни) и скоростта на обработване е добра. Архитектурата R-ROLAP позволява да бъде направен многомерен анализ на OLTP-данни в реални времe.






  1. Сподели с приятели:
1   2   3   4   5   6   7   8   9   ...   12




©obuch.info 2024
отнасят до администрацията

    Начална страница