Во колумна за Факултети.мк студентот Ардиан Абази и проф. д-р Љупчо Коцарев пишуваат за користењето на современите методи од машинското учење и вештачката интелигенција во анализа на податоци собрани преку проектот GDELT
Проектот
GDELT (Global Database of Events, Language, and Tone) е отворена (достапна за сите) глобална база на податоци за нашето општество. Проектот ги следи вестите (од различни медиуми, емитирани на радио и телевизија, печатени и веб-вести) од речиси секој агол на нашата планета на над 100 јазици, со цел да изгради „каталог на човековите/општествените однесувања и верувања во сите земји во светот, поврзувајќи ги личностите, организациите, локациите, темите, изворите на вести и настани низ целата планета во единствена масивна мрежа“.
Проф. Љупчо Коцарев (лево) и Ардиан Абази
Живееме во ерата на податоци, се користи терминот големи податоци (Big Data). Според некои аналитичари, во моментов во светот има неколку зетабајт податоци (zettabyte): 1 зетабајт е еднаков на 10 на степен 21 бајтови (за споредба, староста на нашиот универзум се проценува на околу 14 милијарди години, 1 милијарда е еднаква на 10 на степен 9). Од каде доаѓаат сите тие податоци? Еве неколку примери: „Гугл“ обработува повеќе од 40.000 пребарувања секоја секунда, или 3,5 милијарди пребарувања на ден; 1,5 милијарда луѓе се активни на „Фејсбук“ секој ден; две третини од светското население сега поседуваат мобилен телефон.
Неодамна, во 2019 година, Заедничкиот центар за истражување, со седиште во Испра, Италија, сервис за наука и знаење на Европската комисија, објави технички извештај за динамички модел на глобален индекс на ризик од конфликт (ГИРК). Целта на Центарот е да обезбеди научна поддршка за европскиот процес на креирање политики, додека самиот извештај е направен во соработка со експертски панел на истражувачи и креатори на политики. Во однос на класичните индекси (базирани на модели на регресија), динамичкиот индекс ја интегрира и идентификува секоја фаза во развојот на конфликтот. Различни податочни множества поврзани со конфликти нудат нови методи и начини за мерење и предвидување на конфликтите со користење големи податоци.
Користејќи податоци за настани што сигнализираат потенцијални предизвикувачи на насилни конфликти, вклучувајќи демонстрации, штрајкови или насилство поврзано со избори, целта на моделот е да процени и предвиди појавување на материјални конфликтни настани, под претпоставка дека зголемувањето на конфликтите оди заедно со намалување на материјалната и/или вербалната соработка.
Од методите на машинско учење и вештачка интелигенција, во моделот се користат рекурентни мрежи со долго-кратки мемориски ќелии (Long-Short Term Memory Cell Recurrent Neural Network). Овие модели се добри за класифицирање, обработување и предвидување на временски серии, особено кога станува збор за предвидување на блиски настани. Предвидувања со моделот може да се прават на месечна основа, при што се користат податоците од проектот GDELT.
Нормализирани месечни вести групирани во четири класи за Македонија
Моделот е имплементиран за Македонија и Слика 1 ги сумира резултатите. На сликата се покажани нормализирани месечни вести во период од 1980 година до денес за Македонија, групирани во четири класи: вербална соработка (Q1), материјална соработка (Q2), вербален конфликт (Q3) и материјален конфликт (Q4). Подетална анализа на сликата ќе биде презентирана на друго место, но јасно можат да се уочат настаните во 2001 година и околу 2017 година. Врз основа на моделот може да се изгради алармен систем, кој информира во случај да постои висок ризик од конфликт во дадена земја.
Вештачката интелигенција, машинското учење и големите податоци несомнено го менуваат нашиот живот. Но тие, за жал, може да завршат и како основен сервис на авторитаризмот. Така, воведувањето мерки за заштита на податоците, соодветни прописи и мерки за спроведување на прописите, треба да се однесуваат за обете, можните примени и можните злоупотреби на вештачката интелигенција, машинското учење и големите податоци.
Пишуваат: Ардиан Абази, студент на ФИНКИ и д-р Љупчо Коцарев, професор на ФИНКИ