Manuel

2349889836_703d691671_b

Ce manuel pratique est consacré aux méthodes modernes de text mining et d’analyse des contenus. Il s’appuie largement sur les ressources de r et notamment de tm, Tidyverse … C’est surtout un manuel en chantier qui est développé au fur et à mesure de nos progrès, de nos expériences.

Son plan est progressif, on commence par la préparation des données et on finit par l’automatisation avec du machine learning.  En conclusion, un état des recherche sur l’application du deep learning au texte, mais là on va au-delà du projet.

Autour de ce plan, dans la section blog des applications spécifiques, et dans les tricks, des actualités de r et de ses packages, des astuces de codages.

Chapitre 0 : Acquérir les données (API, Scrapping, scan, OCR…..)

Chapitre 1 : Préparer les données (80% du boulot et de bons dictionnaires)

Chapitre 2 : Compter les mots (c’est par là que ça commence)

Chapitre 3 : La vénérable AFCM ( et un salut à Pierre)

Chapitre 4 : Ngram ( un mot ne suffit pas…)

Chapitre 5 : Topic Analysis (de quoi qu’on cause ?)

Chapitre 6 : Clustering (le jeu des 7 familles)

Chapitre 7 : Vectorisation ( il sera question d’un très gros oursin)

Chapitre 8 : TSNE ( de la perplexité pour tout mettre à plat)

Chapitre 9 : Analyse du sentiment (cris et lamentations)

Chapitre 10 : Prédire pour annoter ( quand la machine est entraînée…)

Chapitre 11 : Les perspective du deep learning ( rêvons un peu)

Annexe I : les fonctions utilisées.

…..

Publicités

Laisser un commentaire

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s