Profiel, patroon en what the “piep” is een algoritme?

Stel: Je bent een online vragenlijst aan het invullen. “Wat is uw geslacht?”. Man. “Wat is uw leeftijd?”. 57 jaar. “Wat is uw lengte”. 175 cm. “Wat is uw gewicht?”. 85 kg. “Hoeveel minuten per maand doet u aan sport?”. 60 min. “Waar heeft u op dit moment last van?”. Mijn rug. Even vooropgesteld dat deze gegevens niet op mijn persoontje van toepassing zijn. Een druk op de knop “Volgende” laat de volgende tekst tevoorschijn komen. “U bent niet meer de jongste, bovendien veel te dik en u doet veel te weinig aan sport. Geen wonder dat u rugpijn of andere ongemakken heeft!”

Bovenstaande is natuurlijk onzin en ontzettend kort door de bocht maar dient als voorbeeld aan de hand waarvan ik iets wil uitleggen. Door vragen te stellen over een aantal kenmerkende factoren, ook wel determinanten genoemd, wordt de invuller letterlijk in een hokje geplaatst. In het hier besproken hokje zitten mannelijke 55-plussers die te zwaar zijn, te weinig sporten en lichamelijk ongemak kennen. “Wat voor nut heeft dat nu weer?” hoor ik je al zeggen. Nou. Voor bijvoorbeeld een lifestyle-coach zou zo’n hokje, gevuld met honderden gegevens, mits aangevuld met contactgegevens, een goudmijntje zijn. In zo’n hokje zitten dus gegevens van personen die voldoen aan een aantal overeenkomstige kenmerken. Ze voldoen dus aan een bepaald profiel. Met andere woorden: Een profiel is dus zo’n hokje.

Met behulp van een serie slimme vragen kun je de invuller indelen in een van de door jou vooraf gedefinieerde profielen. Volgens de letterlijke definitie noemt men “een eindige reeks instructies die vanuit een gegeven begintoestand naar een beoogd doel leiden” een algoritme. Toen ik het woord “algorithm” op een Engelstalig congres hoorde dacht ik eerst nog dat we met zijn allen op de maat moesten gaan staan te klappen, maar dat terzijde.

Over algoritmen bestaat de laatste tijd discussie. Stel: Een bedrijf heeft online een vragenlijst gepubliceerd omdat er vacatures open staan. Naast wat algemene vragen over naam, geslacht, geboortedatum, woonplaats, telefoonnummer en mailadres gaat de lijst wat verder in op opleiding, werkervaring en ambities. Na het invullen van de vragenlijst krijg je direct te zien of je wordt uitgenodigd voor een gesprek of dat je “helaas niet in aanmerking komt voor de baan”. Misschien dat je zoiets wel handig vindt. Dat het systeem in ieder geval eerlijk is en dat je meteen weet waar je aan toe bent. Maar de vraag is of het allemaal wel eerlijk is. Want hoe komt dit algoritme aan zijn keuze om iemand wel of juist niet uit te nodigen? Alleen de maker weet dit. Misschien krijg je op het moment dat je je geboortedatum intypt wel min 10 punten omdat je een 55-plusser bent. Of dat je sowieso afvalt omdat je een vrouw bent? En dat die vragen over werkervaring en ambitie helemaal niet in de berekening worden meegenomen. Er zijn mensen die op dit soort algoritmen onafhankelijk toezicht willen. Ze willen transparantie over hóe de invuller in een bepaald hokje wordt gestopt. Je snapt dat een vraag naar geboorteplaats of nationaliteit al helemaal gevoelig ligt.

Soms laten we ons willens en wetens in hokjes plaatsen. Neem nu Facebook of LinkedIn. Veel mensen beantwoorden het verzoek om maar “zo volledig mogelijk je profiel in te vullen”. Voor iedere onlineshop moet je wel een account aanmaken en ja, daar is vaak een profiel aan gebonden. “Om jouw gebruikerservaring te verbeteren en toegespitst op jóuw interesses informatie aan te bieden!”

Google laat op jou zijn algoritme los terwijl je dat eigenlijk niet in de gaten hebt. Er staan geen duidelijke vragen in een formulier waar je antwoord op kunt geven. Of waarbij je het antwoord veldje leeg laat omdat men “daar niets mee te maken heeft”. Google verzamelt gegevens aan de hand van jouw zoekopdrachten. Kijk voor de gein maar eens in jouw Google account, Gegevens en personalisatie en dan Advertentiepersonalisatie. Daar staan items – Google noemt ze factoren – op basis waarvan Google de advertenties afstemt op jouw interesses. Bovenaan die lijst legt Google uit hoe deze afstemming tot stand komt. De letterlijke tekst: “Advertenties worden gebaseerd op persoonlijke info die je hebt toegevoegd aan je Google-account, gegevens van adverteerders die samenwerken met Google en de schatting van Google over je interesses.”

Hummm. “Gegevens van adverteerders die samenwerken met Google.” Die adverteerders, maar ook iedere willekeurige websitebouwer, kan namelijk een dienst van Google gratis afnemen, te weten Google Analytics, waarmee zij een enorme hoeveel informatie over de bezoeker van hun website kunnen verzamelen én analyseren. Hoe wordt de website gevonden, in welke stad woont de bezoeker, hoeveel seconden bekijkt hij de pagina’s, klikt de bezoeker op de bestel-knop? En nieuwe gegevens worden dus weer doorgegeven aan Google. Google ziet in al die gegevens een patroon waarmee een schatting wordt gemaakt over wat jij leuk vindt. O ja: Chrome, waarmee je op internet kunt browsen, is ook van Google. Interessante video’s kijken op YouTube? Yep. Ook van Google.

Onlangs ben ik toegetreden tot de club van Netflix kijkers. Op dit moment “bingewatch” ik de serie Lucifer, die gaat over de duivel die uit de hel is ontsnapt om hier op Aarde een leuke tijd te beleven. Hij is eigenaar van een nachtclub, heeft een enorme aantrekkingskracht op de mooiste vrouwen en werkt samen met een vrouwelijke rechercheur die overigens totaal niet valt voor zijn charmes.

Ik krijg tegenwoordig van die vage advertenties van Zalando op mijn facebook te zien. Ik heb nooit iets besteld bij die winkel maar regelmatig komen aanbiedingen voor doorzichtige damesslipjes en lederen “over-knee laarzen” voorbij…

Toeval of algoritme?