Pour parvenir à créer cet algorithme, il s'est appuyé sur la tendance prononcée des humains à entretenir des relations avec des personnes ayant des traits similaires, des ressemblances, ce qu'il nomme "homophilie", et qui révélerait un certain nombre de caractéristiques personnelles, telles que : le sexe, l'origine ethnique, l'âge, la religion, l'orientation sexuelle, le niveau d'éducation, ou encore les opinions politiques. Et ce, même si certains se refusent à donner leurs informations personnelles ! Il suffit juste qu'une partie de leurs contacts aient fait le choix inverse, pour accumuler des informations intimes que l'on imagine à tort cachées et indétectables.
La méthodologie employée par l'auteur fut la suivante : entre Janvier et Août 2009, il a collecté près de 28 millions de tweets anglophones postés par environ 5 millions d'utilisateurs, ce qui était très représentatif à l'époque. Les informations concernant les abonnements et les abonnés de ces utilisateurs furent également répertoriées, afin de connaître les liens entre les comptes. C'est à partir de cette base de données qu'ont été constituées toutes ses recherches.
Les deux tiers de ces utilisateurs avaient indiqué une vague localisation, et seulement un tiers leur nom complet. Mais ce fut suffisant pour permettre au chercheur de géolocaliser avec précision 50% de la base de données. Pour la plupart des caractéristiques personnelles citées plus haut (opinion politique, orientation sexuelle, etc.), il affirme avoir atteint dans certains cas une quasi-exactitude à hauteur de 95%. Le plus difficile semble-t-il est en fait de déterminer l'âge et le sexe des utilisateurs anonymes, la précision des résultats est très inférieure.
Pour ceux qui souhaiteraient empêcher efficacement toute atteinte à leur vie privée, il fait une recommandation radicale : ne pas accepter d'abonnés. Ce qui revient à une mort numérique.
Parallèlement, je suis tombé sur cette information ce matin indiquant que Facebook autorisait à partir de maintenant l'accès, aux sociétés développant des applications sur le réseau social, aux informations personnelles des utilisateurs (avec leur accord préalable). Mise en lien avec le papier de ce chercheur espagnol, on comprend donc qu'il suffit que lesdites sociétés s'emparent de cet algorithme ou créent leur propre version, pour disposer du profilage de la totalité des utilisateurs de Facebook. Puisqu'il suffit qu'une partie des membres seulement donnent leur autorisation consciemment ou non ! Ce qui est proprement renversant...
Et ce n'est que le début bien sûr, car avec le temps les algorithmes sont sans cesse améliorés et perfectionnés afin d'augmenter leur pertinence et leur performance. On se dirige donc vers un monde de plus en plus "transparent", où plus rien ou presque ne pourra être dissimulé au plus grand nombre ou aux entreprises commerciales. Qu'on se le dise.