Centre of Expertise Applied Artificial Intelligence

Woorden doen ertoe

Wat is de rol van algoritmes op sociale media data op het taalgebruik van mensen?

15 jul 2024 15:05 | Applied Artificial Intelligence

Lera Boroditsky, cognitief wetenschapper (University of California, San Diego) bespreekt in een TedTalk1 uit 2017 de rol van taal op de manier waarop we denken. Ze geeft aan dat Aboriginals geen woorden hebben voor links en rechts, maar locaties aangeven met een geografische woorden: oost, west, noord, zuid. Een vlieg op hun linkervoet wordt aangegeven als een vlieg op zuidwest. Dat geeft een heel andere beleving van ruimte. Ze geeft aan dat er ook grote verschillen zijn tussen specifieke talen om eenzelfde situatie te beschrijven. Een incident waarbij een man per ongeluk een vaas omstoot wordt in het Engels weergegeven als : “hij heeft de vaas gebroken”. In het Spaans is de taal voor hetzelfde incident, “de vaas is gebroken”. Het benoemen in het Engels dat de vaas is gebroken door toedoen van een man geeft een implicatie van schuld, die misschien helemaal niet past bij de essentie van een ongelukje.

De woorden die we uitspreken geven lading aan de communicatie. De zin “Yassine heeft weer een nieuwe baan”, is een mededeling. Echter, door het woord weer in de zin komt er een lading aan de feitelijke mededeling. We willen meer weten, wat is er aan de hand, is het goed of slecht dat Yassine een nieuwe baan heeft? Het gaat niet meer over welke baan, met welke inhoud, of over de gevoelens van Yassine omtrent deze stap. Het gesprek neemt een richting naar een mening hoe vaak Yassine van baan mag wisselen.

Woorden doen ertoe. Ik bedoel dan niet het grammaticaal correct Nederland spreken, hoewel ik toch iedere keer weer het zinnetje “beter als mij” in mijn hoofd verbeter in “beter dan ik”. Het gaat mij om bijwoorden en bijvoeglijk naamwoorden als “weer”, “nog steeds”. Het gaat om lading die we aan zinnen geven, zoals met een zin “de rechter vindt het niet goed” of “die klimaatsukkels hebben weer de snelweg geblokkeerd”. Een rechter heeft geen mening en vindt helemaal niets van de situatie, een rechter toetst wetgeving en doet een bindende uitspraak. Veronderstellen dat er geen professionele afweging maar een mening doorslaggevend is geeft een wantrouwen in de rechtstaat aan. Als mensen een snelweg blokkeren vanuit een overtuiging dan kun je het daarmee eens zijn of niet. De duiding “klimaatsukkels” geeft een duiding van afkeuring, maar ook van minachting voor de overtuiging. Polarisatie in een samenleving wordt gevoed door taal.

We zullen moeten nadenken wat taal met onze manier van leven doet, niet alleen in de fysieke wereld, maar ook in de virtuele wereld. Met het creëren van de virtuele communicatieplatforms, die ook algoritmes gebruiken om onderwerpen en specifieke teksten te maken, is er een nieuwe taal ontstaan die ons beïnvloed. Niet alleen ons welzijn, maar ook onze taalvaardigheid. En daarmee onze manier van denken.

De rol van virtuele platforms, i.h.b. sociale media Sociale media bevindt zich in de virtuele werkelijkheid, mensen zijn niet fysiek in elkaars nabijheid aan het communiceren. Ze kunnen zelfs anoniem, of onder een alias, avatar of organisatie identiteit communiceren. Dat leidt tot een ander taalgebruik, tot andere omgangsregels, en andere fatsoensregels.

Het platform X, voorheen Twitter, staat bekend als het riool van de communicatieplatforms. De zin “Yassine heeft weer een nieuwe baan” zal op X/Twitter waarschijnlijk reactie oproepen die Yassine veroordelen om deze stap: ”weer een nieuwe baan, wat een loser ben jij dat je geen baan kunt vasthouden”. Als de naam Yassine alleen niet al racistische reacties oproept. De waarheid dat Yassine weer een nieuwe baan heeft omdat zij zo goed werk levert dat zij twee keer achter elkaar promotie maakt is niet bekend. Maar dat doet er niet meer toe in de X omgeving, er is een framing ontstaan vanuit onwetendheid, maar met een mening. Een genuanceerde reactie met een vraag waarom Yassine een nieuwe baan heeft, of wat zij er zelf van vindt wordt niet verwacht op dit platform. Waarom eigenlijk niet?

De rol van automatisering Datasets geven een virtuele weergave van de fysieke werkelijkheid. Deze data wordt met sensoren en data invoersystemen verzameld uit de fysieke wereld. Data kan mensen helpen om inzicht te krijgen of kan worden geanalyseerd met algoritmes. Er zijn feitelijk twee dimensies waarbij automatisering en virtuele werkelijkheid een rol spelen: Fysiek Mens Computer Virtueel De fysieke wereld wordt door mensen beschreven en verbeeld, voor het handelen bestaan er ook geautomatiseerde systemen (zoals een lift, of een auto). Een virtuele wereld geeft mensen data om inzicht te krijgen en om te kunnen beslissen. We kunnen deze beslissingen ook automatiseren met (data science) algoritmes en AI.

Sociale media platforms bevinden zich ook in de onderste twee kwadranten (om met de Aboriginals te spreken Zuidoost en Zuidwest) waarbij in het linkerkwadrant de mensen inhoud schrijven en in het rechterkwadrant algoritmes worden ingezet. Chatbots, grote taalmodellen, fake news, het zijn voorbeelden in het rechterkwadrant van door machines geproduceerde taal, met onderliggende AI modellen en geanalyseerde data.

Shannon Vallor, in haar nieuwste boek The AI mirror (juni 2024), geeft aan dat technische systemen met AI modellen getraind zijn op data uit het verleden, hoe recent ook. Daarmee werken de resultaten van die modellen als spiegel op menselijk gedrag. De onderste kwadranten zijn een spiegel voor de bovenste twee, zoals je in water een reflectie kunt zien van het omliggende land.

De invloed van sociale media taal op de menselijke taalvaardigheid In de analyses van sociale media wordt uitgebreid gesproken over de negatieve, discriminerende, bedreigende teksten en de negatieve invloed die dit heeft op het welzijn van mensen. Minder aandacht is er voor de invloed van deze teksten op het taalgebruik van mensen in de fysieke wereld, ook de taal in de traditionele media.

Laatst was ik aan het kijken naar de voetbalwedstrijd Duitsland tegen Denemarken op het Europese Kampioenschap 2024. De voetbalcommentator Jeroen Grueter kreeg achteraf veel reacties op het feit dat hij meer met het slechte weer rondom het stadion bezig was dan met het verslag van de voetbalwedstrijd. Ik hoorde hem op een gegeven moment met verheven stem zeggen: “onvoorstelbaar dat de scheidsrechter nu nog laat doorspelen”. De aandacht was groot voor een dreigend gevaar. Uiteindelijk bleek het slechts een hevige regen- en hagelbui en de situatie was door de UEFA en de scheidsrechter groep volledig onder controle. De mening van de commentator leek meer ingegeven door zijn gebrek aan informatie en zijn onveiligheidsgevoel. Maar een mening had hij wel.

Wie leert dit taalgebruik nu van wie? Sociale media platforms die door mensen wordt gevuld, zonder filter van menselijke sociale omgangsvormen, worden gebruikt om chatbots en algoritmes te trainen om taal te produceren die waarachtig wordt gevonden omdat het op de taal van mensen lijkt. Daarbij worden de algoritmes zo ingesteld op onderwerpen en taalgebruik dat mensen de teksten blijven lezen. Dit leidt tot een explosie van teksten die steeds meer gefocusseerd en extremer zijn (filter bubbels). Het bijeffect dat deze teksten de manier waarop we onszelf uiten, en de manier waarop we denken, ook beïnvloed heeft ook aandacht nodig.

Je kunt mensen die veel op X zitten misschien herkennen aan hun taalgebruik, op sociale media en in het dagelijkse leven. Dus luister naar je vrienden en mensen om je heen, of train een algoritme om anonieme haatverspreiders en paniekzaaiers online te identificeren. De woorden die zij uitspreken hebben mogelijk de vijf kenmerken die typisch zijn voor sociale media taal:

1. Framing van situaties, trending sentimenten worden geprojecteerd op het huidige gesprek. “we leven in een maatschappij waarin dit kan, ja dat is normaal tegenwoordig he”.

2. Het geven van meningen. Toegevoegde bijwoorden en tussenzinnen waarin een mening wordt gegeven in feitelijke boodschappen.

3. Aandacht voor extreme situaties en (denkbeeldige) bedreigingen, tot aan complot theorieën of fake nieuws berichten toe.

4. Aanvallen op autoriteit, zoals scheidsrechters, politici, vermeende elite.

5. Personaliseren van organisaties en actoren, niet de gemeente, maar een specifieke wethouder of persoon doen iets. Veelvuldig gebruik van voornamen, vooral van overheidswerknemers. “Femke heeft de politie gestuurd”. De nuance komt misschien terug als we weer vragen durven stellen, als we het even niet hoeven te weten en als we het aankunnen om geen mening te hebben