Pagerank binnen Sociale Netwerken

December 2nd, 2008 - Posted by Ulco in Adverteren, Gibberish, Tools

Logo HyvesHyves is zo groot dat het interessant moet kunnen zijn voor marketeers. Aan de andere kant zijn de middelen die Hyves biedt vrij beperkt. Voor een uitzendbureau heb ik ooit een flight van 20.000 euro aan banners op de site losgelaten en dat leverde nog geen 400 bezoekers op. Riekt naar weggegooid geld dus…

Een paper over dit probleem (Optimal Marketing Strategies over Social Networks) inspireerde de me om ook eens naar de mogelijkheden te kijken. Een kleine waarschuwing voordat je het leest: Ik ben fan van wiskundige benaderingen maar als jij dat niet bent kun je het misschien beter overslaan ;-)

Eigenlijk staat direct in de introductie het meest waardevolle stukje “A sale to one buyer often has an impact on other potential buyers. Such an effect is called the externality of the transaction.”. Om de kosten zo laag mogelijk te houden is het dus belangrijk om die personen te bereiken waarbij het neveneffect maximaal is.

Identificeren van invloedrijke nodes

Een netwerk bestaat uit nodes (knopen), binnen Hyves is elk profiel zo’n node. In tegenstelling tot wat in de grondwet staat zijn die nodes niet allemaal hetzelfde. De ene heeft meer vrienden, meer profielweergaven enzovoort. Het wordt dus de truc om de belangrijkste nodes eruit te filteren.

Om dat te bereiken heb ik een spider geschreven die ongeveer hetvolgende doet:

  • Alleen indexeren van zichtbare profielen
  • URL van het profiel
  • Per profiel vastleggen van startdatum en profielweergaven
  • Aantal eerstelijns vrienden
  • Zichtbaar aantal tweedelijns vrienden (op overzichtspagina)

In eerste instantie heb ik alle profielen gedumpt met meer dan 1000 vrienden. Die zijn of artiest of goldmember en hadden voor mijn gevoel een lagere beïnvloedingswaarde. Het resultaat voor mij was een dataset van ongeveer 1,3 miljoen profielen waarmee ik vervolgens aan de slag kon.

Rangschikken met Pagerank-logica

Pagerank werkt met de logica dat elke link de kans vergroot dat een bezoeker op een pagina terecht komt. Hetzelfde geldt voor Hyves waar elke vriend de kans vergroot dat een bezoeker op jouw profiel komt. Vrienden van vrienden vergroten die kans (in mindere mate) ook weer en dus tellen die ook. Aangezien ik maar 9 vrienden kan scrapen moet hier wel wat aan geëxtrapoleerd worden.

De stap die ik voor hem op Pagerank is dat ik ook het aantal profielweergaven weet. Het aantal profielweergaven gedeeld door het aantal dagen dat een profiel actief is wordt de multiplier in mijn algoritme. Mijn rangschikkingsformule wordt dan ongeveer zo:

Score = (profielweergaven / dagen actief) x ((vrienden/10) + (0,5 x ((aantal vrienden van eerste 9 vrienden / 9000) x totaal aantal vrienden))

Ben je er nog? Tijd voor een voorbeeld: Miepmiep. Ze heeft 381 vrienden, de eerste 9 vrienden hebben samen 3357 vrienden. Haar profiel is 8237x bekeken en is actief sinds 20-06-2005. Daarmee komt haar score op 713,0.

Nog één: Rosanne, die heeft 327 vrienden en haar eerste 9 vrienden hebben 2876 vrienden. Een lagere vriendenscore dus maar wel 14871 profielweergaven sinds 19-06-2006. Daarmee komt haar score op 1408,3.

Miep zal het niet leuk vinden maar de beïnvloedingsscore van Rosanne is bijna twee keer zo hoog en voor ons project dus veel interessanter.

Hoe dan te gebruiken?

Het resultaat wat ik nu heb is een dataset van 1,3 miljoen mensen gerangschikt op beïnvloedingsscore binnen Hyves. Een simpele vervolgstap kan zijn dat ik ze mail om te vragen of ze een achtergrond van mijn merk op hun profielpagina willen plaatsen. Dat levert een redelijke exposure op maar waarschijnlijk nog een vrij lage beïnvloeding.

Een tweede optie is dat ik de top 500 een gratis shirt aanbiedt van mijn merk. Stel je bent G-star of Mexx dan kan dat best leuke reclame zijn die door heel veel mensen gezien wordt. Doelgerichte sampling dus. Zo zijn er natuurlijk nog 100-den toepassingen te bedenken maar ik moet natuurlijk nog wat ruimte voor eigen creativiteit laten ;-)

Disclaimer

Een klein twijfelgeval is of Hyves dit wel toelaat. In principe ben je een gewone spider, net zoals Google en die wordt ook toegang verleent. De TOS hoef je op zo’n manier niet te accepteren (geloof ik). Het wordt iets anders als je de mensen ook daadwerkelijk gaat benaderen omdat je daarvoor als gebruiker ingeschreven moet zijn. Hoe dat precies zit laat ik echter graag aan de experts over…

6 Reacties tot nu toe

  • Leon December 4, 2008 @ 10:20 am

    Interessante materie. Daar moesten we binnenkort nog maar eens boompje over opzetten :-).

  • Michiel de Nijs December 18, 2008 @ 5:14 pm

    Hyves zal waarschijnlijk niet zo content zijn met jouw software maar daar zou ik mij niet druk over maken. Zolang je je spider niet extreem veel query’s achter elkaar laat uitvoeren zal het een hele opgave worden om jouw ip te weren.

    Zie jij trouwens nog mogelijkheden om de database nog verder te vullen met meer node-specifieke data? Woonplaats, geslacht, leeftijd, interesses zouden jouw database pas echt interessant maken.

    Als ik nadenk over mogelijkheden zou deze data vooral goed van pas kunnen komen bij seeding activiteiten.

    Een tijd geleden is er trouwens een ontwikkeling van Google in het nieuws geweest die veel lijkt op jouw aanpak. (http://www.news.com.au/story/0,23599,24439850-2,00.html)

    Anyway, keep up the good work en hou ons op de hoogte Ulco. Bij deze ben ik je meest recente RSS-abonnee!

  • Alex February 8, 2009 @ 11:46 pm

    De goudmijn die sociale netwerken momenteel vormen als surrogaat menselijke input voor scrapers en ander geautomatiseerd spul is met dit voorbeeld weer goed duidelijk :)

    Leuk voor iedereen die een hekel heeft aan content creatie en dit liever automatiseert. Met Amazon’s nep AI “Mechanical Turk” kun je zeer interessante meta data koppelen aan je scraped social network informatie. Bijvoorbeeld of iemand blond is of andere ontbrekende informatie.

    Helaas wel een US based gebruikersgroep, maar met de juiste input en creatieve vragen kun je een heel eind komen met NL content ;-)

  • dave March 18, 2012 @ 1:57 pm

    Interessante artikel.

  • wilders September 12, 2012 @ 7:20 pm

    Bedankt voor de informatie, dit is voor iedereen wel een stap naar verder succes

  • Vertaalbureau Textwerk September 24, 2014 @ 10:55 am

    Niet meer heel actueel nu, dat weet ik, maar zoiets zou ook op Facebook moeten kunnen toch?