Inteligența artificială devine din ce în ce mai bună la trecerea testelor concepute pentru a măsura creativitatea umană. Într-un studiu publicat astăzi în Scientific Reports, chatbots AI au obținut puncaje medii mai mari decât oamenii la Alternate Uses Task, un test utilizat în mod obișnuit pentru a evalua această abilitate.
Cercetătorii au început prin a le cere celor trei chatbots AI - ChatGPT și GPT-4 de la OpenAI, precum și Copy.Ai, care este construit pe baza lui GPT-3 - să găsească cât mai multe utilizări posibile pentru o frânghie, o cutie, un creion și o lumânare, în doar 30 de secunde.
Indicațiile lor au instruit modelele lingvistice mari să găsească utilizări originale și creative pentru fiecare dintre obiecte, explicând că era mai importantă calitatea ideilor decât cantitatea lor. Fiecare chatbot a fost testat de 11 ori pentru fiecare dintre cele patru obiecte. Cercetătorii au dat, de asemenea, aceleași instrucțiuni la 256 de participanți umani.
Cercetătorii au folosit două metode pentru a evalua atât răspunsurile AI, cât și cele umane. Prima a fost un algoritm care a evaluat cât de mult se apropia utilizarea sugerată pentru obiect de scopul inițial al acestuia. Cea de-a doua metodă a constat în solicitarea către șase evaluatori umani (care nu știau că unele dintre răspunsuri fuseseră generate de sistemele de inteligență artificială) de a evalua fiecare răspuns pe o scară de la 1 la 5 în funcție de cât de creativ și original era - 1 fiind deloc și 5 fiind foarte creativ. Au fost apoi calculate scorurile medii atât pentru oameni, cât și pentru AI.
Deși scopul studiului nu a fost acela de a dovedi că sistemele de inteligență artificială sunt capabile să înlocuiască oamenii în rolurile creative, acesta ridică întrebări filosofice cu privire la caracteristicile care sunt unice oamenilor, spune Simone Grassini, profesor asociat de psihologie la Universitatea din Bergen, Norvegia, care a condus cercetarea.
__________________________________________________________________________________________________