Дипломна работа Лист № Съдържание: Обзор. 2 Грид систем


Стандарти и терминология в ГРИД системите



страница2/9
Дата18.09.2016
Размер0.59 Mb.
#10053
ТипДиплом
1   2   3   4   5   6   7   8   9

1.4. Стандарти и терминология в ГРИД системите.


С нарастване на интереса към грид системите се увеличава необходимостта от стандарти, които да се използват в грид архитектурата. Един от най-важните стандарти в това отношение е Архитектурата за отворени грид услуги (Open Grid Services Architecture – OGSA). Той е издаден от Global Grid Forum (GGF) и представлява спецификация, която дефинира обща, стандартна и отворена архитектура за грид приложения. Тази спецификация цели да стандартизира почти всички услуги, които грид приложенията могат да използват. OGSA специфицира архитектура, ориентирана към услугите (Service-Oriented Architecture – SOA) за грид, която създава модел на изчислителна система, състоящ се от множество разпределени изчислителни шаблони. Като технология за реализация на последните се предвиждат уеб услугите. OGSA стандартът дефинира интерфейси на услугите и определя протоколите за използване на тези услуги, но не предоставя конкретна реализация. Друг важен стандарт дефиниращ именно интерфейсите е Интерфейс за отворени грид услуги (Open Grid Services Interface - OGSI). Този стандарт определя механизмите за създаване, управление и размяна на информация между Грид услуги. Една Грид услуга е уеб услуга, която отговаря на набор от интерфейси и режим на работа, които определят как клиентът взаимодейства с една Грид услуга. OGSI предоставя Език за дефиниране на уеб услуги (Web Service Definition Language – WSDL) с помощта на който се описват интерфейсите в Грид системите. Друг често срещан термин в Грид средите е GridFTP. Това е сигурен и надежден протокол за пренос на данни, предоставящ висока производителност и е оптимизиран за големи мрежи притежаващи висока пропускателна способност. Както може да се предположи от името му, той е базиран на интернет ФТП протокола и включва допълнения правещи го предпочитан инструмент в Грид средата.

2. Основни понятия и идеи в ГРИД технологията.

2.1. Типове ресурси в ГРИД.


Един ГРИД представлява набор от машини, които по някога биват наричани възли, ресурси, членове, клиенти както и по много други начини. Те всички допринасят всякакви комбинации от ресурси към мрежата като цяло. Някои от тези ресурси могат да бъдат използвани от всички потребители на ГРИД средата, докато други от ресурсите може да са обвързани със специфични ограничения.

2.1.1. Изчисления.


Най-често предоставяния ресурс е изчислителната мощ, осигурена от процесорите на машините участващи в ГРИД-а. Процесорите може да се различават по скорост, архитектура, софтуерна платформа, както и други фактори които оказват влияние, на пример оперативна памет, дисково пространство, свързаност. Има три главни начина по които може да се използват изчислителните ресурси на един ГРИД.

Първият и най-прост начин е да използваме ГРИД-а за да изпълним едно приложение на машина която е на разположение вместо да бъде изпълнено локално.

При вторият е необходимо да използваме приложение което е предназначено да раздели работата по такъв начин, че отделни части от задачата да бъдат изпълнени паралелно на различни процесори.

Третият начин е да се изпълни приложение, което трябва да бъде изпълнено многократно на различни машини от ГРИД-а. Мащабираемостта е мярка която показва колко ефективно се използват изчислителните възли в един ГРИД. Ако за изпълнението на една задача се използват два пъти повече процесори и тя завършва за половината от времето необходимо и за изпълнение, тогава се казва че е идеално мащабируема. Възможно е обаче да има ограничения на мащабираемостта, когато едно приложение може да бъде разпаралелено върху ограничен брой машини или отделните части на приложението са зависими помежду си и е необходимо получаване на резултат от даден възел за да продължи работата си друг такъв.



2.1.2. Съхранение.


Вторият най-често срещан ресурс използван в ГРИД е съхранението на данни. Грид предоставящ интегриран изглед на съхранение на данните се нарича по някога Даннов ГРИД. Всяка от машините в ГРИД-а, обикновено предоставя някакво място за съхранение било и то временно. Това може да бъде памет свързана с процесора или енерго независима памет посредством твърди дискове или други перманентни носители. Оперативната памет обикновено е много бърза, но не е постоянна. Тя би се използвала най-добре за кеширане на данни или като временна памет при изпълнението на едно приложение.

Съхранението на перманентни носители в един ГРИД може да бъде използвано по интересни начини за да се увеличи капацитета, производителността, споделянето и надеждността на данните. Много ГРИД системи използват монтируеми мрежови файлови системи, като Andrew File System (AFS®),Network File System (NFS), Distributed File System (DFS™), или General Parallel File System (GPFS). Тези файлови системи предоставят различна производителност, сигурност и надеждност.

Капацитетът може да се увеличи посредством използването на пространство на множество машини с помощта на обединяваща файлова система. Всеки един файл или база от данни може да се разпростира върху няколко устройства или машини, елиминирайки ограниченията за максимален размер на файла, често налагани от файловите системи на съответната операционна система.

Фиг. № 2 Съхранение на данните.

Някои по сложни файлови системи при ГРИД могат автоматично да дублират набори от данни за да предоставят независимост и да повишат надеждността и производителността. Интелигентен GRID планировчик може да помогне за избирането на най-подходящите устройства за запазване на данните. В следствие на това задачите могат да бъдат планирани за изпълнение възможно най-близо до данните, за предпочитане на същата машина където са и данните необходими за изчисленията. Разделянето на данните може да се извърши от ГРИД файловата система, както е илюстрирано на фигурата. Когато има повтарящ се или предсказуем достъп до данни, тази техника може да създаде усещането, че устройствата за съхранение на данни могат да боравят с данни много по бързо. Това може да се окаже важно за мултимедийни даннови потоци или за системи събиращи голямо количество от данни.

ГРИД файловата система може да имплементира journaling благодарение на което е възможно възстановяването на данни по надеждно в следствие на някаква повреда. В допълнение някои файлови системи предоставят синхронизиращи механизми за да намалят натоварването, когато данните са споделени и обновявани от много потребители.



2.1.3. Комуникации.


Капацитета и пропускателната способност на мрежите в днешно време расте постоянно и е достигнал до нива които правят ГРИД изчисленията практични. Въпреки това не трябва да е изненадващо, че още един важен ресурс от ГРИД-а е капацитета на комуникационната мрежа. Това включва вътрешна и външна комуникация за системата. Вътрешната комуникация е важна за да се изпращат задачи и необходимите данни за изпълнението им. Някои задачи се нуждаят от повече данни за изчисленията си и е възможно данните да не се намират на машината на която се изпълнява задачата. Пропускателната способност, която е на разположение за такава комуникация често може да се окаже критичен ресурс, който може да ограничи оползотворяването на системата.

Външният комуникационен достъп до интернет може да се окаже ценен когато се изграждат центрове за търсене. Машините в един ГРИД може да имат връзки с интернет в допълнение на свързаността между отделните възли. Когато тези връзки не споделят същата комуникационна пътека те се добавят до цялостната налична пропускателна способност за достъп до интернет. Понякога са необходими независими комуникационни връзки за да се предотврати отказ в някоя връзка или за по голяма пропускателна способност при нужда.

Това, което направи грид-технологията възможна, е интензивното развитие на мрежовите технологии. Стимулирана от интернет икономиката и масовото разпространение на оптичните влакна в телекомуникационните системи, продуктивността на глобалните компютърни мрежи (wide-area network, WAN) се удвоява на всеки девет месеца. Някои глобални мрежи оперират с 155 мегабита в секунда (Mbps), докато през 1985 американските центрове със суперкомпютри ползваха връзка от 56 килобита (Kbps) - това е ускорение от 3000 пъти за 15 години. Представете си, че ако и при колите имаше такова увеличение на скоростта от 1985 година... лесно бихте могли да излезете в орбита.

Разбира се, разстоянията никога няма да отпаднат напълно. Например, за да работят с колеги, разпръснати по света, и за да анализират голямо количество данни, някои учени ще се нуждаят от още по-бърза връзка - над 10 гигабита в секунда (Gbps). Други учени ще изискват минимално изчакване за стартиране на приложението им (задачата), така че да не се получават забавяния, когато работят в реално време с други колеги в грид-средата.

Други ще искат да се осигури навременно изпращане на данните в рамките на грид-инфраструктурата, така че сложните пресмятания могат да бъдат изпълнени, което изисква постоянна комуникация между процесорите. За да се предотврати забавяне в комуникациите, трябва да се разработят стратегии за преодоляване на всеки неуспех, който възникне в грида-инфраструктурата по време на изчисленията - било грешка при обмена или в работата на компютъра.

За да се отговори на тези предизвикателства и изисквания, трябва да се работи по посока на оптимизиране на протоколите за трансфер (Transport Protocols) и разработване на технически решения като високоскоростно превключване в Етернет мрежата.



2.1.4. Защитен достъп.


Защитения достъп при грид-технологията е директно следствие идеята за съвместно използване на ресурсите. Разпределянето на ресурсите създава едно от най-големите предизвикателства за разработването на грид-технологиите:

  • Политика на достъп - собствениците на ресурси и потребителите трябва ясно да определят кой е упълномощен да дава права на достъп, кои ресурси са за общо ползване, както и всички отговорности, произтичащи от правото на достъп до ресурсите;

  • Идентификация - необходим е механизъм за разпознаване на потребителя или ресурса;

  • Упълномощаване - необходим е механизъм за определяне дали операцията е съвместима с дефинираните правомощия при разпределянето.

Разбира се, на грида му е необходим ефективен начин за запазване на тази информация: кой е упълномощен да използва грид-инфраструктурата и кои ресурси са му разрешени да използва? Кой разпознава, че даден потребител е този, за който се представя? Какви са наложените рамки за използване на различните ресурси?

Всичко това може постепенно да се промени, затова е необходимо грид-системата да бъде извънредно гъвкава и да има надежден механизъм за достъп. При поддържането на сигурността на информационните технологии се говори за "троен достъп" - издаване на разрешително, разпознаване на потребителя и регистриране (accounting), и важи в пълна сила и за грид-технологията.

Проблемът не е нов и подобни ситуации възникват и далеч извън науката, например когато използвате кредитната си карта в ресторанта! Разликата е, че грид-технологията изисква нов тип решения на проблема.

След необходимостта от доверие на дневен ред застава въпросът за сигурността. Вие можете да имате доверие на другите потребители, но сигурни ли сте, че вашите данни и приложения са защитени, докато преминават през глобалната мрежа, за да стигнат до компютърните ресурси, или докато се изпълняват на други компютри? Без подходяща защита, е възможно някой да използва вашите данни (поверителни или не) и може да ги модифицира. Освен това, без адекватна защита, е възможно вашите данни да бъдат прочетени от собственика на компютъра от грид-инфраструктурата, където те се съхраняват, или от някой хакер.

Предстои да се свърши много работа, за да се намери решение на всички тези въпроси, които всъщност касаят целия спектър от информационни технологии, а не само грида. Например защитната стратегия може да се осъществи с използване на усъвършенствани технологии за кодиране както при прехвърлянето на данни, така и при тяхното съхранение във външен ресурс. Непрекъснато се разработват нови решения на проблемите по сигурността, но сигурно този процес ще е безкраен с оглед на не добронамерените хакери.

2.1.5. Софтуер и лицензи.


Една ГРИД система може да има инсталиран софтуер, който да е прекалено скъп за инсталиране на всички машини. При използването на ГРИД, задачите за които е необходим този софтуер се изпращат към възлите на които е инсталиран съответния продукт. Когато таксите за лицензи са високи, този подход може да спести значителна част от финансите на една организация. Някои видове лицензи разрешават инсталирането на даден програмен продукт на всички възли от системата, но ограничават едновременната употреба на всички машини до определен брой.

2.1.6. Задачи и приложения.


Въпреки че в ГРИД среда се споделят и използват разнообразни видове ресурси, всички те обикновено се достъпват посредством изпълнимо приложение или задача. Най-често под терминът приложение ще се разбира най-високото ниво на работа на ГРИД-а. Въпреки това, понякога терминът задача се използва еквивалентно на приложение. Приложенията могат да бъдат разбити на определен брой задачи както е показано на фигурата. Тези задачи може да бъдат също разбити на подзадачи ако това е необходимо

Фиг. № 3 Обработка на задачи.


Задачите са програми, които се изпълняват на подходящ възел от системата. Те може да пресмятат нещо, да изпълнят една или повече системни команди, да преместят или да събират данни. Грид приложение което е организирано като колекция от задачи, обикновено е проектирано да се изпълнява на части върху отделните възли. Задачите може да имат специфични зависимости, които да ги възпрепятстват от паралелно изчисление. На пример, може да са необходими специфични входни данни, които трябва да бъдат копирани на машината където ще се изпълнява задачата. Някои задачи може да се нуждаят от данните пресметнати от други задачи за да започнат и следователно чакат да получат необходимата информация. В крайна сметка резултатите от всички задачи трябва да се съберат и подходящо обединят за да произведат крайния изходен резултат за приложението.

  • Проблеми при обработването на подзадачи на отдалечени компютри.

Когато се разпределя работата между отдалечени компютри. Трябва да се има предвид, че тези компютри могат да отпаднат от мрежата (поради много различни причини – неизправности в комуникационната среда, спиране на електричеството захранващо даден компютър, претоварване на даден ресурс и други) по всяко време. При това ако на тях се е обработвала задача от чиито резултати зависи по-нататъшната работа на друга задача или много задачи те ще трябва да чакат докато дадения компютър не се завърне обратно в мрежата. Това обаче може да е много голям период от време, което не е желателно.

Един подход за решаване на този проблем е следният: При разпределянето на задачата на части се знае точно коя част на кое звено е дадена за обработка. При отказ в звеното дадената подзадача се изпраща за обработка на друго звено.

Проблем обаче е когато откаже звено, на което се съхранява информация, която е необходима за работата на Грида. Например големи масиви от дискове в изчислителни центрове и други. Но разбира се и за това се взимат предпазни мерки, като най простата е да се прави back-up копие на всяка важна информация, като обаче тези копия не се съхраняват на едно и също място, защото ако са на едно място и копието и оригинала и например спре тока на цялата сграда в която се намират нито едното нито другото ще функционира. Затова се съхраняват на различни места и при отказ на едното копие се работи с другото и когато отказалото възвърне работоспособността си двете се синхронизират (промените в работилото се извършват и в другото за да са отново еднакви).

Може да възникнат грешки и при предаването на данните по комуникационната среда, но за това се взимат мерки от самата среда, SP (Spanning Tree) протоколи, CRC (кодове за разпознаване на грешки) кодове за предаване и други механизми за разпознаване и коригиране на грешки, които обаче не се осъществяват от Грид мрежата, а от самите средства за комуникиране и използване на съобщителната среда.

Разбира се проблеми се появяват и в много други ситуации в различни звена и слоеве на Грид мрежата.



Каталог: 123
123 -> Възникване и развитие на телевизионната индустрия. Модели телевизионни организации
123 -> Списание „Прозорец”3/12
123 -> Н а р е д б а за реда за придобиване, управление и разпореждане с общинско имущество
123 -> Програма за действие по околната среда: Към устойчиво развитие Европейска Общностна програма за политиката и действията по отношение на околната среда и устойчивото развитие
123 -> Curriculum vitae
123 -> За произхода на някои български названия на малки предмети Живка Колева-Златева
123 -> Съобщение на комисията до европейския парламент и съвета план за действие за намаляване на инцидентния улов на морски птици в риболовните уреди
123 -> На научната продукция на ДНК маргарита карамихова
123 -> Програма за овм. Концепция за опазване и мониторинг на овм, чрез изграждане на мрежа от сътрудници по места


Сподели с приятели:
1   2   3   4   5   6   7   8   9




©obuch.info 2024
отнасят до администрацията

    Начална страница