Програмите на вештачката интелигенција имаат повеќе начини на учење нови работи. Истражувањето спроведено од научниците од „DeepMind“ покажува како нивните агенти самостојно учат нови работи, а резултатите се симпатични.
Три агенти добиле задача да дојдат од точката А до точката Б, а научниците ги интересирало дали можат со награда да ги развијат моторните вештини на нерамни терени и препреки. Заклучокот - можат!
Резултати
„Изборот на комплексна животна средина би можел да го олесни учењето“, велат научниците. Некои од заклучоците до кои дошле и хипотезите кои ги потврдиле за секој од трите агенти се:
Планар Вокер: Спонтано научи да скока преку празнини помеѓу две платформи, да скока и да оди преку препреки и да се наведнува под платформата. На самиот крај од експериментот Вокер може да ја прескокне препреката со висина колку неговата.
Квадрупед: Различен од Вокер, со оглед на кратките нозе кои не му овозможуваат едноставен премин дури и при наједноставните пречки. Но кога тренира на терен кој одговара на неговиот дизајн, започнува да ги развива стратегиите со чија помош ги поминува пречките.
Хуманоид: Најкомплексен од сите три. Потешко учи и се држи до сигурни алгоритми со чија помош поминува преку теренот. Но со текот на времето поминува низ теренот низ кој не поминал никогаш со минимални грешки и со дополнителна надворешна сила.
Програмата е прекината во два случаи: кога растојанието меѓу главата и нозете е помало од 0,9 метри и кога растојанието меѓу главата и подот е помало од 1,1 метар.