Големите данни възможност, предизвикателство или заплаха пред официалната статистика


Предизвикателства пред официалната статистика



Pdf просмотр
страница3/12
Дата26.01.2023
Размер0.86 Mb.
#116401
1   2   3   4   5   6   7   8   9   ...   12
Големите данни - възможност, предизвикателство или заплаха пред официалната статистика
Свързани:
26 Задача. 1 Тема. Условие., 26 Задача. 3 Тема. Условие.

Предизвикателства пред официалната статистика
Срещата на големите данни с официалната статистика води до много и различни предизвикателства.
Едно от най-големите предизвикателства пред статистиците при използването на големите данни засяга методологията. При провеждане на едно традиционно изследване статистиците дефинират генерална съвкупност, разработват дизайн на извадката, събират данните и т.н. Много източници на големи данни като например съобщенията в социалните мрежи нямат добре дефинирана генерална съвкупност, структура и качество. Това прави трудно прилагането на традиционните статистически методи, основани на теорията на извадковите изследвания. Основната особеност е, че при работа с големи данни първо идват събраните данни и след това статистиците трябва да приложат специфични методи за тяхната обработка и анализ (визуализационни методи, техники за извличане на знания от данни или други методи, които да „направят големите данни малки”). Наред с методологията важен елемент на официалната статистика е осигуряването на информация с високо качество. Дали сегашните принципи и стандарти за качество са пряко приложими за големите данни, или е необходимо да бъдат подходящо адаптирани?
Поверителността и правните въпроси са друго предизвикателство.
Защитата от разкриване на идентичността на индивидите е задължителна, но това е трудно да се осигури, когато е свързано с големите данни. Проблемът с големите данни е, че често потребителите на услуги и устройства, генериращи данни, не са запознати, че правят това и/или за какво тези данни могат да бъдат използвани впоследствие. Друг правен въпрос е свързан с авторските права и собствеността на данните. Дори ако данните могат легално да бъдат използвани, това не предполага че е разумно или подходящо да се направи с оглед нарушаване на тяхната конфиденциалност. Например в някои случаи може да бъде полезно да се приложи подходът на информираното съгласие. Някои договори за абонамент на мобилна


5 услуга включват клауза за използване на данни от договора за други цели освен за предоставяне на самата услуга.
Обработката, съхранението и трансферът на големи масиви от данни създават предпоставки за възникване на чисто технологично предизвикателство.
Технологичният напредък - нарастването на компютърната мощност, по-големи ИТ устройства за съхранение и високоскоростни канали за данни, може частично да реши тези въпроси. Събирането на данни в реално време отваря нови възможности за комбиниране на административни данни с високоскоростни големи данни, идващи от различни източници, като търговски данни (трансакции с кредитни карти, онлайн разплащания, продажби и др.), мобилни устройства и сензори
(мобилни телефони, GPS, камери, метеорологични сензори, сензори за замърсяване на въздуха и др.), социални медии (Twitter, Facebook, Google) и други обществено достъпни данни.
Друго предизвикателство е възможната променливост и съпоставимост
на източниците на големи данни, имайки предвид факта, че официалната статистика поддържа анализ на динамичните редове. За много потребители продължаването на тези динамични редове е от особена важност и това не може да бъде пренебрегнато.
Не на последно място е размерът на финансовите ресурси, които статистическите институти трябва да заделят, за да придобият права на собственост върху големи данни, чиито собственици са компании от частния сектор. Още повече, че съгласно настоящото законодателство статистическите институти придобиват данни от държавни институции, вкл. от административни регистри и респонденти, безвъзмездно.
За да използва ефективно големите данни, официалната статистика се нуждае от експерти с различно мислене и нови умения, които да могат да извличат ценно „познание” от данните. Такива специалисти са т.нар. изследователи на данни („data scientists”).
Големите данни за официалната статистика означават и по-голям обем информация, която е предмет на дефиниране на нови политики и директиви за управление и защита на тази информация.
Всички изброени предизвикателства пораждат основателния въпрос: не е ли дошло време за големите данни и тяхното място в официалната статистика да се мисли неконвенционално и в нова перспектива? Очевидно е, че към момента мисленето изостава по отношение на информационните технологии и големите данни.


Сподели с приятели:
1   2   3   4   5   6   7   8   9   ...   12




©obuch.info 2024
отнасят до администрацията

    Начална страница