Ben je geïnteresseerd in de wereld van wetenschap & technologie en wil je hier graag meer over lezen? Word dan lid van KIJK!
Sergei Monakhov ontwikkelde algoritmen die effectief de berichten van trollen kunnen opsporen. En dat op basis van taalpatronen in slechts vijftig tweets.
Wie een beetje op het internet leeft, is welbekend met zogeheten ‘internettrollen’. Deze accounts verspreiden opzettelijk haatzaaiende berichten, doen zich voor als iemand anders (impersonatie) of verspreiden misleidende informatie. Dit altijd met een bepaald doel voor ogen, zoals het verwarring zaaien of het sturen van discussies.
Hoe groot de impact van trollen kan zijn, bleek wel tijdens Amerikaanse verkiezingen in 2016. Zo zou Moskou een Russisch ‘trollenleger’ hebben ingezet om de verkiezingen te sturen in het voordeel van Donald Trump.
Voor dit probleem denkt Sergei Monakhov, onderzoeker aan de Freidrich Schiller Universiteit in Jena, een oplossing te hebben. Met behulp van een tweetal complexe algoritmen weet hij effectief de trol-tweets van serieuze berichten te onderscheiden, zo schrijft hij in PLOS ONE.
Lees ook:
Twitterbibliotheek
Al eerder probeerden onderzoekers om misleidende tweets uit de berichtenmassa te vissen op basis van gebruikte hashtags, geografische data en de snelheid waarmee de berichten geplaatst en verwijderd worden. Maar Monakhov gooit het over een andere boeg. Hij knutselde twee algoritmen in elkaar die troll-tweets van serieuzere tweets weten te onderscheiden aan de hand van taalgebruik.
In de regel bevatten troll-tweets een duidelijke terugkomende boodschap. Maar nog belangrijker, zo ontdekte Monakhov, zijn de vreemde constructies van woorden en woordcombinaties die hieruit voortkomen. Dit komt waarschijnlijk doordat de trollen een relatief kleine collectie aan standpunten hebben die ze herhaaldelijk willen verspreiden. Tegelijkertijd moeten ze dit op voldoende verschillende manieren formuleren om niet te veel op te vallen.
Hoge precisie
Om de algoritmen te trainen maakte Monakhov gebruik van publieke twitterberichten geplaatst door Amerikaanse congresleden, maar ook een enorme bibliotheek vol berichten van Russische trollen. Op basis van slechts vijftig tweets slaagden zijn algoritmen erin de troll-tweets met hoge precisie (91 procent) uit de overige berichten te filteren. Het systeem wist zelfs de verwarrende en soms provocerende tweets van Donald Trump keurig te onderscheiden van ‘echte’ troll-berichten.
De onderzoeker hoopt dat zijn neurale netwerk kan worden ingezet om weerstand te bieden in de cyberoorlog met internettrollen. Het idee is dat de berichten snel kunnen worden opgespoord en verwijderd, zonder dat daarbij de vrijheid van meningsuiting in het gedrang komt. Voordat het zo ver is moet het algoritme zijn kracht nog bewijzen tegen ander soort berichten (lees: door niet-publieke figuren). Aan de slag!
Bronnen: PLOS ONE, EurekAlert!
Beeld: Monakhov, 2020 (PLOS ONE, CC BY)