Големите данни възможност, предизвикателство или заплаха пред официалната статистика


Методите на статистиката и големите данни



Pdf просмотр
страница4/12
Дата26.01.2023
Размер0.86 Mb.
#116401
1   2   3   4   5   6   7   8   9   ...   12
Големите данни - възможност, предизвикателство или заплаха пред официалната статистика
Свързани:
26 Задача. 1 Тема. Условие., 26 Задача. 3 Тема. Условие.
Методите на статистиката и големите данни
Възниква фундаменталният въпрос: могат ли големите данни да се обработват и анализират с методите на статистиката? По-конкретно, това означава изследователите да могат да използват корелационния, дисперсионния и хи квадрат анализ, когато проверяват своите научни тези. В допълнение това означава още, че те могат да се възползват от целия инструментариум за проверка на хипотези.
Очевидно е, че към традиционния инструментариум от теорията на статистиката ще бъдат включени и други подходи за изследване и анализ. Това обстоятелство на практика откроява две насоки за развитие на научноизследователската работа:


6
• Използване на добре известните статистически методи за анализ. Това създава условия за съчетаване на данните от официално провежданите статистически изследвания с потоците от големи данни.
• Въвеждане на други подходи, начини и методи за самостоятелно или съчетано използване на големите данни.
Възниква също въпросът: какво печели официалната статистика от използването на големите данни за аналитични цели? Очакванията в тази посока са най-вече в две направления:
• Намаляване на натоварването на респондентите. Това е особено важно, тъй като в последните години статистическите изследвания се развиват особено екстензивно. Потребностите от информация нарастват лавинообразно. Нарастват също и изискванията по отношение на качеството, бързината и детайлизацията на информационния продукт. Все повече внимание се обръща на информационната осигуреност на малки териториални пространства. Стремежът да се дефинират най- добрите и оптимални управленски решения налага разработването на нови показатели и подходи за съчетаване на данните от текущата статистика и големите данни.
• Намаляване на цената на информационния продукт. Известно е, че статистическите изследвания имат своя цена, която се повишава в зависимост от поставените условия за представителност, точност и достоверност на статистическите оценки. Колкото по-високи са изискванията в това отношение, толкова по-големи ще бъдат разходите за направените изследвания. Стойностите могат да бъдат екстремални. Например ако се постави изискването точността на оценките от едно извадково статистическо изследване да нарасне два пъти, то обемът на извадката трябва да нарасне четири пъти. Това означава, че разходите за изследването (отпечатване на документи, заплати, транспортни разходи, консумативи, обучение на по-голям брой анкетьори, евентуално заплащане на респондентите и т.н.) също нарастват четири пъти при равни други условия.
Най-големите опасности от технологична гледна точка, които следва да се имат предвид, когато се съчетават данните на официалната статистика и големите данни, са:
• Достоверност на големите данни. Разгледани в този аспект, големите данни изключително много зависят от източника на тяхното генериране.
Използването на индикатори, гарантиращи достоверността на източниците, е от първостепенно значение за качеството на големите данни.
• Представителност на големите данни. От съществено значение за представителността на големите данни е тяхното селектиране, избор и систематизация. Това означава, че субективният подход за тяхното генериране трябва да бъде елиминиран. Принципите и условията на рандомизация следва да бъдат водещи при определяне на данните, които се използват в съчетание със статистическите данни, отговарящи на същите условия.
• Точност на големите данни. Обемът на големите данни трябва да бъде достатъчен, за да се редуцира стохастичната грешка. Това означава, че големите данни имат висока аналитична значимост. Тази предпоставка предопределя качеството на изводите и посланията към потребителите.


7
На практика това са фундаментални понятия от теорията на извадковите статистически изследвания, които следва да бъдат ключът към успешно, целево и аналитично съчетаване на данните от официалната статистика и големите данни.


Сподели с приятели:
1   2   3   4   5   6   7   8   9   ...   12




©obuch.info 2024
отнасят до администрацията

    Начална страница