Reading time ~ 2 minutes ->

Pour les 10 ans d’adada, j’ai voulu marquer le coup et faire un petit cadeau à Jérome. Sans qu’il ne le sache, j’ai récupéré puis analysé le contenu de son site ce qui m’a permis d’aborder ces différents sujets :

  • l’extraction de données
  • le nettoyage de données
  • le scraping de contenu
  • l’extraction d’informations
  • la jonction de plusieurs tables
  • l’enrichissement de données supplémentaires
  • la labélisation de titre
  • la repésentation graphique de réseau
  • le Text Mining
  • la représentation sous forme de nuages de mots
  • l’analyse de sentiments

Sous forme d’un petit livre en ligne, cette étude me permet de vous montrer ce qu’il est possible de faire à partir d’un site accessible au public, c’est à dire accessible à vous et moi. Imaginez cela dans le cadre d’une analyse concurrentielle, d’un audit SEO… c’est une mine d’informations qu’il est possible de récupérer et d’analyser. Couplez cela avec les statistiques de visites et c’est une véritable cartographie que vous obtenez de votre asset numérique.

Assez parlé. Le contenu est dense. Pour ceux dont le process et le code intéressent peu, vous pouvez sauter la première section pour découvrir les premiers graphiques. Ceux-ci sont en petits dans le livre, mais n’hésitez pas à les ouvrir dans un nouvel onglet pour les avoir en grand.

Pour ouvrir le livre, c’est par ici adada - dark side of a blog