Истражувачите од Универзитетот во Јужна Калифорнија биле заинтересирани за тоа дали голем јазичен модел може да произведе хумористична содржина. Претходните истражувања се фокусирале на анегдотски примери на ЛЛМ кои прават шеги со повеќе или помалку успех. Овие примери, иако интересни, не ја испитувале способноста на „Чет-ГПТ“ да произведува хумор на начини споредливи со луѓето, ниту пак истражуваа колку е смешен „Чет-ГПТ“ за пошироката јавност.
За да ја споредат духовитоста на луѓето и јазичниот модел, истражувачите спровеле два теста. Во првиот, тие побарале од „Чет-ГПТ 3.5“ да генерира хумористични сатирични наслови во стилот на „Кромид“, а потоа ги споредиле со материјали објавени на страниците на ова сатирично списание, напишани од професионални хумористи. Луѓето ја оценувале духовитоста на одговорите, несвесни дали се создадени од луѓе или вештачка интелигенција. Резултатите од испитувањето, објавени во списанието ПЛОС ОНЕ, покажуваат дека шегите генерирани од „Чет-ГПТ 3.5“ биле оценети како посмешни од шегите создадени од луѓе.
Истражувачите откриле дека повеќе од две третини од учесниците на тестот ги оцениле шегите генерирани од „Чет-ГПТ“ како посмешни од оние направени од луѓето. Нешто повеќе од 25% од учесниците ги оцениле одговорите направени од луѓето како посмешни, а пет проценти од нив ги оцениле шегите од двата извори како еднакво смешни. Резултатите биле конзистентни кај сите демографски групи, без оглед на возраста, полот или расата на учесниците.
Друг тест покажал дека луѓето не прават разлика помеѓу наслови напишани во стилот на сатиричното списание „Кромид“, без разлика дали се создадени од професионални хумористи или вештачка интелигенција. Испитаниците ги сметале насловите на „Чет-ГПТ“ исто толку смешни како и оригиналните наслови.
Двете студии опфатиле по три задачи. Во првата, луѓето и вештачката интелигенција создавале смешни нови фрази за вообичаени кратенки. Во втората задача тие морале да генерираат смешни одговори со пополнување празни места во реченици. Трет тип задачи подразбирале смислување духовит потсмев за вакво сценарио: „Замислете една од вашите пријателки сака да слушне ваше мислење за тоа колку добро пее, а вие сте вџашени од тоа колку лошо пее. И кога таа ќе ве праша како е, вие одлучувате да бидете искрени и да речете: _____.“
Овие три задачи резултирале со повеќе од 945 шеги напишани од 105 автори. „Чет-ГПТ“ генерирал по 20 смешни одговори за вкупно 180 шеги. Истражувачите биле инспирирани за студијата откако многу холивудски сценаристи ја изразиле својата загриженост за употребата на големи јазични модели во забавната продукција и неодамнешните штрајкови на сценаристите и актерите за вештачката интелигенција, бидејќи тие гледаат директна егзистенцијална закана за нивните професии, уметност и човечка креативност.
Извор: bug.hr
Фото: Freepik