Sites die bepalen welke boeken/films/muziek je leuk zou moeten vinden, komen meestal niet met heel verrassende suggesties. Dat kan beter, zeggen Zwitserse, Chinese en Slowaakse wetenschappers.
We kennen ze allemaal wel: de zogenoemde recommender systems, die je bijvoorbeeld op Amazon vertellen welke boeken je ‘ook eens moet proberen’. Wat die systemen gemeen hebben, zo stellen Tao Zhou en andere onderzoekers in het tijdschrift PNAS, is dat ze uitgaan van overeenkomsten. Zo kijken verkoopsites vaak naar wat je eerder hebt gekocht of aangeklikt, terwijl de digitale videorecorder TiVo je kijkgedrag en de scores die je hebt uitgedeeld in aanmerking neemt bij het doen van suggesties.
Dat zorgt ervoor dat dergelijke programma’s heel accuraat kunnen zijn, zeggen de wetenschappers. Met andere woorden: ze raden de gebruiker opties aan die waarschijnlijk wel in zijn of haar straatje liggen. Maar dat is naar hun mening niet zaligmakend: “Echt waardevol wordt zo’n programma pas als het zaken aan kan raden die gebruikers niet gauw zelf hadden gevonden.” Met andere woorden: een recommender system moet niet alleen accuraat, maar ook divers zijn. En Zhou en collega’s denken een manier te hebben gevonden om zo’n best-of-both-worlds-situatie te bereiken.
Ze gaan daarbij uit van twee algoritmes, genaamd HeatS en ProbS. Het eerste bestudeert het netwerk van gegevens dat het voor zijn kiezen krijgt op een manier die doet denken aan de verspreiding van warmte (heat-spreading; vandaar de naam). Het tweede algoritme gebruikt een andere truc: dat gaat als het ware met willekeurige stappen door de data (een random walk of toevalsbeweging). Laat je beide methodes los op gegevens van Amerikaanse filmverhuurder Netflix, de muzieksite Rate Your Music of de social bookmarking site Delicious, dan geeft HeatS de meest diverse, en ProbS de meest accurate tips, zo melden de onderzoekers.
En wat gebeurt er als je beide methodes combineert? Normaal gesproken kleeft daar een groot nadeel aan; dan moeten er immers twee verschillende berekeningen uitgevoerd worden waardoor het meer tijd kost om tot een lijst suggesties te komen. Maar omdat HeatS en ProbS in de basis bepaalde wiskundige overeenkomsten vertonen, zijn ze elegant samen te voegen. Het resultaat: een hybride systeem dat “niet slechts een compromis is tussen de twee methodes, maar de gebruiker in staat stelt om tegelijkertijd accuratere én afwisselendere suggesties te krijgen”, aldus de bedenkers.
En dat is uiteraard een goede zaak. Want laten we eerlijk zijn: de huidige aanraadsystemen zijn toch vooral goed in het intrappen van open deuren. “Vind je artiest X leuk? Probeer dan ook eens… de albums van artiest X die je nog niet hebt!” Gee, thanks.
Bronnen: PNAS, Nature News
Beeld: Amazon