P.S : Si vous voulez simplement voir le graphique et/ou la liste des 100 comptes à suivre, et que vous n'avez pas envie d'écouter la life du Captain', les résultats sont tout en bas de l'article Dans le cadre de sa thèse, le Captain' travaille sur le rôle d'internet et des réseaux sociaux dans le processus de formation des prix sur les marchés financiers (pour faire simple, du pseudo big-data appliqué à la finance). Une piste de recherche sur laquelle le Captain' travaille concerne le rôle de l'information publiée sur Twitter sur les marchés financiers (impact ou bruit ?). Une piste de cette piste (oui ça fait beaucoup de pistes, mais bon c'est le principe de la recherche académique ) consiste à identifier les utilisateurs influents d'un domaine, voir ce qu'ils racontent sur Twitter, puis relier ça aux mouvements des marchés (prix, volume, volatilité .).
Mais comment identifier les utilisateurs influents sur Twitter ? La méthode la plus simple consiste à regarder le nombre de « followers », et à se dire « plus une personne a de followers, plus elle est importante ». Mais cette méthode à un problème majeur : elle est complètement nulle pas géniale du tout (lire par exemple : "Measuring User Influence in Twitter: The Million Follower Fallacy")! Les raisons sont multiples : possibilité d'acheter des followers, absence de prise en compte des centres d'intérêts, pas de pondération directe ou indirecte
"Ok Captain', mais comment faire mieux ?" La méthodologie présentée ci-dessous est loin d'être parfaite (très loin même il est aussi possible de s'intéresser aux « RT » et discussions entre utilisateurs, voir exemple ici) mais permet, via un algorithme par itération, d'avoir un aperçu intéressant et assez complet d'un réseau à partir d'un échantillon de départ défini.
Et en français, ça donne quoi ? Supposons que vous me donniez le nom de 5 utilisateurs Twitter. Dans un premier temps, je vais extraire via un petit programme Python maison l'ensemble des informations de ces 5 comptes, dont l'identifiant des comptes « followés » (les « friends » Twitter de notre échantillon de base) en me connectant à l'API Twitter. Ensuite, je vais regarder si ces 5 comptes partagent des « amis » (suivent les mêmes comptes) et prendre par exemple tous les comptes qui sont « amis » au minimum avec trois des cinq comptes de l'échantillon de base. Pour l'ensemble de ces nouveaux comptes, je relance alors le programme d'extraction des infos Twitter, en regardant les comptes followés par ces nouveaux comptes. Une fois cette étape réalisée, rebelote, mais avec donc un échantillon plus grand (l'échantillon de base + les comptes de la première itération). Et ainsi de suite, jusqu'à l'infini et l'au delà...
Bon dans notre cas, "l'infini et l'au delà" s'arrêtera à trois itérations, ce qui signifie donc que : (1) on défini un échantillon de base de X comptes d'économistes reconnus ayant un compte Twitter, (2) on regarde l'ensemble des comptes suivis par ces X comptes, et on insère ensuite dans notre base les Y comptes les plus suivis par les X (itération 1), (3) on regarde l'ensemble des comptes suivis par ces X+Y comptes, et on insère ensuite dans notre base les Z comptes les plus suivis par les X+Y (itération 2), (4) on regarde l'ensemble des comptes suivis par ces X+Y+Z comptes, et on insère ensuite dans notre base les W comptes les plus suivis par les X+Y+Z (itération 3)
A la fin, nous avons donc un total de X+Y+Z+W comptes Twitter jugés comme « influents » par l'algorithme, et comme par magie, ce nombre est égal à 100 (la magie se configure dans l'algo). Mais voyons ce que cela donne avec des comptes réels, étape par étape.
1ère étape : Définir les X comptes d'économistes reconnus « à la main »
Cette étape est la seule étape avec intervention humaine. Mais c'est une étape très importante... Afin de donner la première impulsion à l'algorithme, il faut lui donner une base sur laquelle travailler. Pour cela, le Captain' a donc défini une liste de 8 comptes Twitter d'économistes français reconnus. La liste peut être discutée, et si vous avez d'autres suggestions, je me ferais le plaisir de relancer l'algo avec un nouvel échantillon (d'après mes tests c'est assez robuste, mais bon ). Bref, les 8 économistes français sont (l'ordre n'a aucune importance) :
- Augustin Landier : Economiste à la Toulouse School of Economics
- David Thesmar : Economiste, professeur à HEC Paris
- Jean Pisani-Ferry : Economiste, commissaire général à la stratégie et à la prospective
- Denis Ferrand : Economiste, directeur général de COE-Rexocode
- Alexandre Delaigue : Economiste, professeur d'économie à Saint Cyr
- Jacques Sapir : Economiste, directeur d'étude à l'EHESS
- Olivier Bouba-Olga : Economiste, directeur de l'UFR de sciences économiques de l'université de Poitiers
- Ludovic Subran : Economiste, chef économiste Euler Hermes
2ème étape : Les amis de tes amis sont mes amis (Python aussi)
Pour la seconde étape, je regarde donc l'ensemble des comptes suivis par les 8 économistes, avec un raisonnement du type « si un utilisateur est suivi par une majorité de ces 8 économistes reconnus, c'est que cet utilisateur doit être important et doit donc venir compléter mon échantillon ». Et hop, cela me fait donc apparaître 14 nouveaux comptes, allant du compte du Prix Nobel Paul Krugman (@NYTimeskrugman), à celui du chef économiste de Natixis Asset Management Philippe Waechter (@phil_waechter), en passant par Karine Berger (@Karine_Berger), députée et secrétaire nationale à l'économie du PS.
Bon c'est bien beau d'avoir une liste, mais ce qui est intéressant est l'importance de chaque compte au sein de ce réseau et les liens entrants (si votre compte est suivi) et sortants (les comptes que vous suivez) à l'intérieur du réseau. Pour cela, le Captain' utilise le logiciel libre d'analyse et de visualisation de réseau Gephi, qui permet de réaliser des graphiques assez facilement, avec surtout un algorithme de regroupement des utilisateurs (clustering) en fonction du degré de similarité qui est un petit bijou. Et hop, deux trois tours de passe-passe et cela nous donne ce graphique, après la première itération.
La taille et la couleur du cercle représente son importance, en fonction du nombre de liens entrants, c'est à dire en fonction du nombre de personne de ce réseau suivant un utilisateur. Par exemple, Stéphane Soumier (@ssoumier) est suivi par 14 utilisateurs sur un total de 21 possibles dans notre réseau après la première itération (22 utilisateurs au total dans le réseau, mais Stéphane Soumier a beau être très fort, il ne peut pas non plus se suivre lui-même).
Vous avez tout compris ? Et bien ensuite on refait la même chose une fois (itération 2) puis une autre fois (itération 3) et c'est terminé ! Et là, ô joie, ô bonheur, le compte Twitter du Captain' apparaît dans la liste des 100 comptes à suivre (mais non madame, j'ai pas triché) !
3ème étape : Visualisation et clustering via Gephi
Hop on relance l'algo de regroupement (clustering "Force Atlas" dans Gephi) en fonction du degré de similarité des comptes (liens entrants et sortants), on met quelques couleurs et des traits pas droits parce que c'est plus beau, et voilà ce que l'on obtient pour le top 100 des comptes Twitter en lien avec l'économie.
L'algo de clustering permet de définir à la louche différents groupes : à droite les économistes US (Nouriel Roubini, Paul Krugman, Dani Rodrik...), à gauche les politiques proches de l'économie (Arnaud Montebourg, Pierre Moscovici, Fleur Pellerin...), vers le centre les journalistes économiques (Stéphane Soumier, Nicolas Doze, Cyrille Lachevre...). Dans cet exemple, le clustering est intéressant mais pas très clair, tout simplement car l'objectif initial était de créer un réseau partageant comme centre d'intérêt l'économie (donc déjà clusterisé). En cas de sélection aléatoire de l'échantillon de base, le clustering fonctionne beaucoup mieux (le Captain' vous montrera ça un jour, mais bon assez de geekage pour aujourd'hui).
Et voici donc les 100 comptes à suivre, par ordre alphabétique
adelaigue | econ blogger & writer. Tweets fr-en. http://t.co/dwVPC85yOY ; http://t.co/kQw6Nm1nFw Compagnon de @Ariele_72 |
afpfr | Info, coulisses et retweets des 1.500 journalistes de l'AFP à travers le monde. Ailleurs sur Twitter: http://t.co/MhwDPdDJJG |
ArLeparmentier | Directeur adjoint des rédactions du Monde. Animateur du Grand Rendez-vous Europe1. Prix du livre européen 2013. |
AudreyTonnelier | Journaliste éco au Monde - Un pied dans les marchés financiers, l autre dans la grande distribution, essaie de ne pas (trop) se les prendre dans le tapis |
augustinlandier | Economiste, Toulouse School of Economics. #économie #finance #réformes #transparence #opendata #libéralisme #sciences |
AureliaEndAFP | Journaliste à l'AFP, macroéconomie internationale. Paris, après Berlin et Francfort . Tweets et RT n'engagent que moi. |
Bank_Able | Price is what you pay, value is what you get (Warren Buffett) |
bribenkemoun | Journaliste, red chef @motscroises, France 2. Mes tweets n'engagent que moi. |
BrookingsEcon | Aims to increase understanding of how the economy works and what can be done to help it work better. |
Bruegel_org | Leading independent international economics think-tank, contributing to European and global economic policy-making. Fellows sign tweets with their initials. |
B_Eichengreen | George C. Pardee and Helen N. Pardee Professor of Economics and Political Science, University of California, Berkeley, NBER Research Associate, CEPR Res Fellow |
CAEinfo | |
CageJulia | Économiste à l'Université d'Harvard et à l'École d'Économie de Paris. |
canardenchaine | Compte officiel du Canard Enchaîné - La liberté de la presse ne s'use que quand on ne s'en sert pas. |
captaineco_fr | Enseignant-Chercheur Doctorant (Paris 1 Panthéon-Sorbonne, IESEG Paris). Créateur du site Captain Economics |
Cercle_eco | Le Cercle des économistes est un acteur majeur du débat économique qu'il favorise grâce à l'indépendance et à la diversité des positions de ses 30 membres. |
chatignoux | journaliste aux Echos |
ChrisChavagneux | Rédacteur en chef adjoint d'Alternatives économiques, rédacteur en chef de l'Economie politique, débatteur sur France Inter (samedi matin 9H20) |
CoeRexecode | Centre d'études économiques indépendant: Veille conjoncturelle, #prévisions pour l'entreprise - Etudes de politique économique pour la #croissance et l'#emploi |
CyrilleLachevre | Journaliste Macroeconomie à @Lopinion_fr Ex journaliste aux Echos, ex RedChef au Figaro Beaucoup de tweets éco, si possible avec le sourire ! |
delong | Primate, economist, utopian, shrill: macroblog: http://t.co/uVDLXYdxZg |
DenisCosnard | Journaliste au Monde. L'économie dans tous ses états. Un blog personnel sur les anciennes usines de Paris : |
Denis_Ferrand | Economiste, DG de @CoeRexecode, #conjoncture éco worldwide, débat de politique éco France et Europe |
DominiqueReynie | Je suis professeur à Sciences Po et directeur général de la Fondation pour l'innovation politique. Mon dernier livre: Les nouveaux populismes, Fayard (Pluriel). |
dseux | Directeur délégué des Echos, Editorialiste sur France Inter. |
dthesmar | Economist, prof at HEC Paris |
econoclaste | Compte du site éconoclaste (Alexandre Delaigue et Stéphane Ménia, tweets par Stéphane). Retrouvez A.Delaigue sur @adelaigue. Mes RT ne m'engagent pas. |
felixsalmon | Senior editor, @thisisfusion |
fleurpellerin | Secrétaire d'Etat au commerce extérieur, à la promotion du tourisme et aux Français de l'étranger |
freakonometrics | Surreptitious economist & born-again mathematician. Actuary & activit blogger. Data addicted. Professor & researcher in Montréal (QC) and Rennes (France). |
gabriel_zucman | Chasing wealth and income, present and past, onshore and offshore - London School of Economics / Berkeley. |
gduval_altereco | rédacteur en chef d'Alternatives économiques, dernier ouvrage : Made in Germany, le modèle allemand au-delà des mythes, Seuil |
GeoffroyRDB | Entrepreneur, investisseur et Vice-président délégué du #MEDEF |
gmaujean | Rédacteur en chef Finance-Marchés @lesechos |
g_allegre | Économiste, OFCE - inégalités, pauvreté, fiscalité, protection sociale: toutes les nouvelles qui méritent d'être tweetées |
HeyerEric | |
Hgibier | Directeur aux Echos, en charge des projets de développement éditoriaux, |
icouet | Chef du service Marchés Les Echos (Financial markets desk editor) |
IMFNews | Breaking news and alerts from the International Monetary Fund. |
InseeFr | Compte officiel de l'Insee. #Statistiques et études sur l'#économie et la #société françaises. http://t.co/gd59hdNIlN |
inst_entreprise | Institut de l'entreprise - think tank indépendant - travaux & réflexions sur l'entreprise et son environnement |
i_montaigne | Think tank indépendant, l'IM est une plateforme de réflexion, de propositions et d'expérimentations consacrée aux politiques publiques en France. |
jattali | Écrivain, president du Groupe Planet Finance et du Groupe A&A;éditorialiste de l'Express,président du conseil de surveillance de Slate.fr, |
JeffDSachs | Director of the @EarthInstitute and the Sustainable Development Solutions Network (@unsdsn) |
jmvittori | Editorialiste, Les Echos. Comprendre et faire comprendre, l'économie et au-delà. Curious forever. Think and laugh. |
JustinWolfers | Senior Fellow @BrookingsEcon | Professor @UMichEcon & @FordSchool | Contributing Columnist @NYTimes |
Karine_Berger | Députée des Hautes-Alpes, Secrétaire nationale à l'économie du PS |
Lagarde | Managing Director of the International Monetary Fund (IMF). Also follow @IMFNews. |
LaurenceParisot | |
LaurentBigorgne | Institut Montaigne : éducation, enseignement sup, emploi, création et financement d'entreprise, Europe, efficacité énergétique, politiques publiques, fiscalité |
LaurentMauduit | Cofondateur de @mediapart, ex-chef du service éco à #Libération, puis directeur adjoint de la rédaction au #Monde |
LeMondeEcoEnt | Le Monde EcoEnt est le second cahier quotidien du Monde. Retrouvez également des informations inédites sur notre blog. |
LesEchos | L'actualité économique, financière et boursière française et internationale. |
Ludovic_Subran | Chief Economist at @EulerHermes (@Allianz) - Views are my own |
l_peillon | Journaliste à Libération, Rédacteur en chef adjoint, en charge du service Economie |
Maitre_Eolas | Better call Eolas |
Manu_Lechypre | Editorialiste à BFM TV et BFM Business, directeur de l'Observatoire BFM Business, débatteur sur France Inter (0n n'arrête pas l'éco, le samedi, 9h-10h) |
marclandre | Journalist Figaro. Je suis né en 1973 et spécialisé en social. Je suis rédacteur en chef adjoint depuis octobre 2013 et responsable du service EcoFrance. |
MarieVisot | Grand reporter au Figaro -suivi de la politique économique. A lire: Les sales gosses de la République (2014) et ''Christine Lagarde (2011), chez Michel Lafon |
MarkThoma | |
montebourg | Ministre de l'Economie, du Redressement productif et du Numérique. Conseiller général de Montret (71) |
murielmotte | Journaliste à L'Opinion, un média à découvrir absolument ! |
narretepasleco | Le magazine de l'économie de @franceinter. Le samedi à 9h10. Nos tweets n'engagent que nous. |
nberpubs | The National Bureau of Economic Research is dedicated to promoting a greater understanding of how the economy works. |
nbouzou | Economist, writer, TV commentator |
nicolasbarre_ | Directeur de la rédaction des Echos, ex correspondant au Japon et aux Etats-Unis. Editorialiste a Europe1 |
NicolasDOZE | Éditorialiste éco BFM TV + BFM Business - Réagissez en live pendant Les Experts entre 9h et 10h sur BFM Business |
Nouriel | Professor at Stern School, NYU, Chairman of Roubini Global Economics (http://t.co/tqx8X7SEdv), blog at http://t.co/JFU0Jzxvf6 , co-author of Crisis Economics |
NYTimeskrugman | Nobel laureate. Op-Ed columnist, @nytopinion. Author, The Return of Depression Economics, The Great Unraveling, The Age of Diminished Expectations + more. |
obouba | Economiste, Université de Poitiers |
ofceparis | Observatoire Français des Conjonctures Economiques French Economic Observatory |
pdacosta | Reporter covering the Federal Reserve and economics at The Wall Street Journal. Previously at Reuters. Raking in the muck, so you don't have to. |
PedderSophie | Paris Bureau Chief, The Economist. Author of Le déni français http://t.co/0Xdse5wJ |
philippemaniere | Former media/think-tank person, founded and manages a strategy/positioning consulting firm, talking head & author http://t.co/yZLJyJDU4p |
PhilippRicard | Journaliste au Monde, chargé des affaires européennes à Bruxelles. Ancien correspondant en Allemagne. |
phil_waechter | Chief Economist Natixis Asset Management http://t.co/4GSvE956uc |
phiphi_lef | Grand (1m91), lourd (plus de 100 kg), journaliste (France Inter) |
pierrebri | Reuters Breakingviews European editor. Opinions my own. Retweeting no endorsing. Unless it is. |
pierremoscovici | Retrouvez-moi aussi sur Facebook: http://t.co/uN9dOtnjip |
pisaniferry | Economist. Teaches in Berlin. Currently serves in policy in Paris. New book: The euro crisis and its aftermath (http://t.co/N3cCy7Amll) |
ProSyn | The World's Opinion Page || en français: @ProSyn_Fr || en español: @ProSyn_Esp || RT = FYI |
quatremer | Correspondant auprès de l'UE de Libération, auteur du blog Coulisses de Bruxelles. Mes tweets n'engagent que moi tout seul. |
remigodeau | Je suis rédacteur en chef de L'Opinion, le média neuf de Nicolas Beytout. Abonnez-vous sur http://t.co/RGN4MqdSXl |
rodrikdani | |
russeurope | Economiste, spécialiste de la #Russie et des questions monétaires #Euro | @EHESS_fr et @FondationMSH |
Sabinedelanglad | Editorialiste aux Echos (En Vue. Decryptage) Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser. |
samuellaurent | Journaliste et aimant à trolls @lemondefr. Coordinateur des @decodeurs : vérifications, contexte, données |
SophiFay | Journaliste au Nouvel Obs |
ssoumier | Eco, Business etc... http://t.co/UMbcT8HdVH |
stiglitzian | Dedicated to @JosephEStiglitz, Nobel laureate in economics & champion of the poor in the corridors of power. @janzemanek Facebook: http://t.co/qQae1pkzWg. |
Strategie_Gouv | France Stratégie est un organisme de concertation et de réflexion rattaché au Premier ministre. |
TheEconomist | Official site for The Economist. Follow for article updates, events and news from The Economist. To subscribe go to: http://t.co/jOj2ULiVVx |
ThomasWieder | Rédacteur en chef au Monde, chef du service France / Coproducteur de L'Atelier du politique sur France Culture |
thomas_bronnec | Chef des informations @francetvinfo, auteur de Bercy, au coeur du pouvoir (Denoël, 2011) et de Une pieuvre nommée Bercy (France 5, 2012) |
tylercowen | Professor of Economics, George Mason University, blogger at http://t.co/1Pkhb9zvBt. |
UpshotNYT | A New York Times website with analysis and data visualizations about politics, policy and everyday life. |
Valerie_Rabault | Députée de Tarn-et-Garonne (1ère circonscription, Montauban) #Circo8201, Rapporteure du budget à l'Assemblée nationale |
vincentgiret | Le Monde |
voxeu | VoxEU.org is a policy portal set up by the Centre for Economic Policy Research (www.CEPR.org) in conjunction with a consortium of national sites. |
XTimbeau | |
_Bercy_ | Compte officiel des Ministères économiques et financiers de Bercy |
Conclusion : Et voilà, vous avez de quoi vous occuper tout l'été sur Twitter ! Sea, sex and tweet.