Mâna robotică folosind laptop.
Scorurile medii puternice ale AI pentru faptul că LLM -urile sunt instruite pe volume uriașe de conținut de internet, ceea ce le face bine să imite umor popular. (Credit de imagine: Kilito Chan/Getty Images)

Nu renunțați la jobul dvs. de zi, pentru că un nou studiu sugerează asta inteligenţă artificială (AI) este mai amuzant decât tine.

Într-un nou studiu conceput pentru a testa capacitățile co-creative ale modelelor de limbaj mare (LLMS), memorii de internet create de Openai’s GPT-4O Modelul a fost, în medie, mai amuzant, mai creativ și mai partajabil decât cele create de oameni sau de oameni cu asistență chatbot. Cu toate acestea, când a fost vorba de calitatea unor memorii de top, umorul generat de oameni a predominat încă.

Constatările au fost încărcate pe 20 ianuarie la arxiv Preprint server și prezentat la cea de -a 30 -a conferință internațională privind interfețele de utilizator inteligente, care a avut loc 24 – 27 martie în Cagliari, Italia.

Comentând rezultatele din rețeaua socială Bluesky, Ethan Mollickprofesor și co-director al laboratorului AI generativ de la Universitatea Wharton din Pennsylvania, a spus: „Regret să anunț că testul de meme a fost trecut”.

Înrudite: Poți muri din râs?

Testul original Turing a fost propus în 1950 de matematicianul britanic Alan Turing Ca referință pentru inteligența mașinii: dacă un judecător uman nu a putut distinge între un om și o mașină În conversație, mașina s-ar putea spune că expune inteligență la nivel uman.

În timp ce studiul nu a evaluat dacă memoriile generate de AI nu erau distincte de cele făcute de oameni, acesta ridică întrebări interesante despre modul în care evaluăm creativitatea-mai ales că participanții au evaluat adesea conținutul generat de AI mai favorabil.

Obțineți cele mai fascinante descoperiri din lume livrate direct în căsuța de e -mail.

Învățarea machemei

Cercetătorii, de la KTH Royal Institute of Technology, LMU Munchen și Tu Darmstadt, nu și -au propus să demonstreze capacitățile comedice ale AI. În schimb, și-au propus să exploreze co-crearea, în special modul în care LLM-urile pot sprijini oamenii cu sarcini creative precum scrierea glumelor.

Au identificat crearea meme-ului, cu amestecul său de referințe culturale, sarcasm și presiune de performanță cu mize mici, ca cazul de testare perfect. Memorii iau de obicei forma de imagini din titlu din titlu care se ridică asupra situațiilor familiare sau a culturii pop. Au devenit un tip de shorthand de internet partajat, obișnuiau să facă glume sau să răspundă la evenimentele curente într -un format ușor digerabil și adesea ireverent.

„Complexitatea umorului îl face o zonă bogată pentru explorarea dinamicii co-creativității, deoarece colaboratorii trebuie să navigheze pe aceste nuanțe pentru a produce conținut care rezonează cu ceilalți”, au scris cercetătorii în lucrare.

Experimentul a implicat două părți. În primul, cercetătorii au recrutat 124 de participanți și i -au atribuit unuia dintre cele două grupuri: unul care lucrează singur și celălalt lucrând cu un asistent de chatbot AI.

Participanților li s -a oferit apoi trei runde pentru a genera subtitrări pentru șabloane meme clasice pe baza subiectelor de muncă, mâncare și sport – inclusiv Fry de la Futurama, Doge şi Boromir (unul nu merge pur și simplu în Mordor) șabloane. Cei din grupul asistat de AI ar putea folosi un chatbot pentru idei de brainstorm, dar au fost responsabili pentru selectarea celor mai bune idei și crearea memoriilor finale.

Grupul numai pentru om a creat 335 de memorii, în timp ce 307 au fost produse de echipe hibride umane-AI. Un plus de 150 de memorii au fost generate de GPT-4O pentru comparație.

Un al doilea grup de 98 de persoane au evaluat apoi memoriile despre cât de amuzante, creative și partajabile au fost. Meme -urile au fost randomizate, astfel încât evaluatorii nu știau cine sau ce le -a făcut. În toate cele trei categorii, memoriile generate de AI au ieșit deasupra.

„Interesant este că memoriile create în întregime de AI au avut performanțe mai bune decât memorii de colaborare numai pentru om, cât și uman-AI, în toate domeniile, în medie”, au scris cercetătorii în lucrare. „Cu toate acestea, atunci când se uitau la cele mai performante memorii, cele create de oameni erau mai buni în umor, în timp ce colaborările umane-AA au ieșit în evidență în creativitate și sharereabilitate”.

Cu alte cuvinte, în timp ce memoriile generate de AI au marcat în medie cel mai mare, memoriile identificate ca fiind „cele mai amuzante” au fost mai des create de oameni.

Regenerarea conținutului

Cercetătorii au creditat scorurile medii puternice ale AI pentru faptul că LLM -urile sunt instruite pe volume uriașe de conținut de internet, făcându -le să imite un umor larg popular, dar nu atât la aterizarea unui adevărat zinger al unui punchline. „LLM -urile apelează la un gust larg în umor, dar oamenii pot fi mai buni”, au scris ei.

De asemenea, studiul a examinat impactul asistenței AI asupra productivității și a efortului perceput. Participanții care lucrează cu chatbot -ul au generat mai multe idei decât cei care lucrează singuri, dar acest lucru nu s -a tradus întotdeauna în conținut mai amuzant.

Potrivit cercetătorilor, acest lucru se datorează faptului că, în timp ce LLM -urile pot ajuta la generarea de idei, acestea nu ridică neapărat bara de calitate creativă. Acest lucru este valabil în special pentru umor, despre care cercetătorii au spus că a necesitat „calendarul, contextul cultural, cunoștințele împărtășite și capacitatea de a subverti așteptările”.

Cercetătorii au concluzionat: „În timp ce LLM -urile pot genera meme umoristice și adecvate contextual, ei se confruntă adesea cu provocări în captarea referințelor culturale nuanțate și a subtilităților emoționale inerente creativității umane. În timp ce AI poate stimula productivitatea și poate crea conținut care apelează la un public larg, creativitatea umană rămâne crucială pentru conținutul care se conectează la un nivel mai profund.”

Owen Hughes este un scriitor și redactor independent specializat în date și tehnologii digitale. Anterior, redactor senior la Zdnet, Owen a scris despre tehnologie de mai bine de un deceniu, timp în care a acoperit totul, de la AI, cibersecuritate și supercomputere până la limbajele de programare și sectorul public. Owen este interesat în special de intersecția tehnologiei, a vieții și a muncii – în rolurile sale anterioare la ZDNET și TechRepublic, a scris pe larg despre conducerea afacerilor, transformarea digitală și dinamica în evoluție a muncii la distanță.

Mai multe despre inteligența artificială

Chat Icon
Cluburile Știință&Tehnică
Prezentare generală a confidențialității

Acest site folosește cookie-uri pentru a-ți putea oferi cea mai bună experiență în utilizare. Informațiile cookie sunt stocate în navigatorul tău și au rolul de a te recunoaște când te întorci pe site-ul nostru și de a ajuta echipa noastră să înțeleagă care sunt secțiunile site-ului pe care le găsești mai interesante și mai utile.