– Tjänster som Dall-E utlovar oändliga möjligheter, men erbjuder ett mycket begränsat och ideologiskt laddat visuellt språk, säger Gustav Westberg, kommunikationsforskare i svenska språket vid Örebro universitet.
Han har tillsammans med professor Gunhild Kvåle vid Universitetet i Agder undersökt hur AI-verktyget Dall-E 3 skapar bilder av tonåringar. Dall-E är ett bildverktyg som är inbyggt i ChatGPT, som ägs av OpenAI.
För att få ett representativt urval av bilder att analysera använde forskarna allmänna textkommandon, så kallade promptar, som ”skapa bilder av tonåringar”, samt instruerade Dall-E att själv ta fram promptar för att generera bilderna. Båda fallen gav samma resultat.
Studien identifierar fyra kännemärken för AI-bilder.
– Det är slående hur Dall-E å ena sidan är fokuserad på etnisk och könsmässig variation, medan bilderna å andra sidan är så lika varandra. Bilderna visar alla upp unga, framgångsrika, vackra tonåringar, säger Gustav Westberg.
De avbildade ungdomarna är alltså etniskt diversifierade och forskarnas slutsats är att OpenAI, som äger Dall-E och ChatGPT, har tagit till sig kritiken om bristande mångfald i tidigare versioner.
Ett andra gemensamt drag är att bilderna enbart visar lyckliga människor. Tonåringarna mår bra, och deras kroppar, kläder, och prylar signalerar välstånd och framgång. De ser alla ser ut att tillhöra en övre medelklass.
Forskarnas gav Dall-E uppdrag att ta fram bilder på ungdomar som gör saker som ungdomar vanligtvis gör.
– Vi fick bilder på ungdomar som studerar på biliotek, har picknic, spelar instrument och tv-spel tillsammans, idrottar, lagar mat och ägnar sig åt konst, aktiviteter som värderas högt i vår kultur Det finns också normer inbäddade i tekniken. Alla är smala, och inte ens specifika promptar som efterlyste mer varierade kroppar kunde ändra på detta, säger Gustav Westberg.
Det tredje gemensamma draget är att bilderna på olika sätt ger sken av att skildra äkta scener från verkligheten genom att bilderna använder fotografiska uttryck som skärpedjup, ljuskontrast och under- och överexponering.
Den fjärde utmärkande draget är hur AI-bilder kan visa situationer tagna ur fantasin. Ett av exemplen är ungdomar som åker skateboard inuti en snöglob på Nordpolen. Men, fotorealistiska bilder är standarden hos Dall-E 3.
Bildgeneratorer har blivit väldigt effektiva och är tillgängliga för alla.
– Tjänster som Dall-E har och kommer att ha en stark påverkan på vår visuella kultur, inte bara för hur vi kommunicerar, utan också för vilka idéer och värderingar vi kan kommunicera. Generativ AI måste betraktas som lika revolutionerade som fotografiet och televisionen. Masskommunikation är till sin natur upprepande och vi bör kritiskt fråga oss vilka följderna blir när vår visuella kommunikation blir alltmer utslätad, trots de tillsynes oändliga möjligheter som generativ AI erbjuder, avslutar Gustav Westberg.
•
Extern skribent: Örebro universitet