Formation - Introduction à la fouille textuelle avec le logiciel IRaMuTeQ (2J)
Apprenez à fouiller vos données textuelles (verbatims clients, questions ouvertes...) grâce aux outils de statistiques textuelles.
Objectifs
- Préparer un ensemble de textes en vue de son analyse
- Identifier les biais possibles de l'ensemble de données
- Connaitre les concepts fondamentaux de la lexicométrie (ou textométrie et logométrie).
- Utilisation des méthodes d’analyse textuelle, notamment la classification Reinert.
- Choisir la meilleure analyse en focntion de ces besoins ou de son corpus
- Exploration des fonctionnalités d’IRaMuTeQ pour l’analyse qualitative et quantitative des données textuelles.
Contenu de la formation
- Quelles sont les évolutions des verbatims clients cette année ou au cours des 5 dernières années ?
- Quelles sont les thématiques qui structurent les articles de presse mentionnant mon institution ? Sont-elles les mêmes d’un journal à l’autre ?
- Quels sont les discours abordés dans les questions ouvertes de mon formulaire ?
- Quelles sont les idées de mes administrés sur un point précis lors d’une concertation ?
Toutes ces questions peuvent être étudiées grâce à la statistique textuelle. Au-delà des mesures, ces outils permettent de naviguer et de fouiller les recoins de grands ensembles de textes. Plus qu’un simple enseignement d’outil, cette formation vous permettra d’entrer dans la fouille de données textuelles. L’objectif final sera que vous puissiez naviguer dans vos données en fonction des besoins de votre entreprise ou institution. Les outils utilisés sont tous sous licence open source, ce qui signifie que les stagiaires repartiront avec les outils installés et seront directement opérationnels, sans avoir besoin de licences payantes.
Jour 1: Initiation aux statistiques textuelles.
Matinée (9h00 – 12h00)
- Introduction aux Statistiques Textuelles et Types de Données
- Définitions des statistiques textuelles et des différents types de données.
- Du texte et des données, approche complémentaire des discours et des données que l’on peut leur associer (âge, région…)
- Les Statistiques Textuelles Appliquées
- Présentation des méthodes statistiques utilisées dans l’analyse textométrique (spécificités et classification)
- Exemples pratiques pour illustrer l’application des différents types de statistiques textuelles.
- Mise en pratique : constituer un corpus textuel
- construction par petit groupe d’un corpus de données textuelles (article de presse, question ouverte, document administratif…)
- identification des sources possibles, des biais de construction
Après-midi (13h30 – 17h00)
- Présentation d’IRaMuTeQ – Installation et Importation des Données
- Guide d’installation et configuration d’IRaMuTeQ.
- Importation de différents types de données textuelles dans IRaMuTeQ.
- Travaux pratiques – Interface et Premiers Pas
- Prise en main de l’interface d’IRaMuTeQ.
- Démonstration des fonctionnalités clés pour explorer les corpus.
Jour 2: Classification Reinert, Spécificités et Similitudes théories et applications
Matinée (9h00 – 12h00)
- Classification Reinert – Concepts et Méthodologie
- Présentation des étapes de la classification Reinert.
- Variation des corpus et des paramètres de la classification
- Prise en Main de la Classification Reinert avec IRaMuTeQ
- Application pratique de la classification Reinert avec IRaMuTeQ.
- Analyse des résultats et interprétation des classes identifiées.
Après-midi (13h30 – 17h30)
- Activités pratiques guidées
- Application des méthodes avec des exemples pratiques
- exploration libre, aidée par la formatrice
- Fin des explorations, bilan et réponses aux questions
Les stagiaires devront venir avec un ordinateur portable, durant la formation, les outils seront installés et des corpus d’entraînements seront proposés. À la demande des stagiaires et après vérification de la faisabilité, le stagiaire pourra apporter son propre corpus pour s’entraîner.
mots-clés : lexicométrie, textométrie, logométrie, fouille de données, text-mining
Modalités pédagogiques
- Documents supports de formation projetés
- Exposés théoriques
- Etude de cas concrets
- Mise à disposition en ligne de documents supports à la suite de la formation
Evaluation des résultats
- Mises en situations
- Formulaires d'évaluation de la formation
Accessibilité aux personnes en situation de handicap
Veuillez faire connaître vos besoins au plus tôt lors de nos échanges. La prise en compte d'un besoin spécifique peut nécessiter un délai pour étudier les modalités d'adaptation ou d'orientation.
Taux de satisfation des stagiaires
Taux d'abandon
Taux de retour des enquêtes
Toute personne voulant explorer des données textuelles.
savoir utiliser un ordinateur, avoir les droits de gestionnaires sur son ordinateurs.