Formation - Introduction à la fouille textuelle avec le logiciel IRaMuTeQ
Apprenez à fouiller vos données textuelles (verbatims client, questions ouvertes...) grâce aux outils de statistiques textuelles.
Objectifs
- Connaître le fonctionnement des statistiques textuelles
- Utiliser le logiciel Iramuteq
- Préparer un corpus textuel en vue de son analyse
Contenu de la formation
- Quelles sont les évolutions des verbatims clients cette année ou au cours des 5 dernières années ?
- Quelles sont les thématiques qui structurent les articles de presse mentionnant mon institution ? Sont-elles les mêmes d’un journal à l’autre ?
- Quels sont les discours abordés dans les questions ouvertes de mon formulaire ?
- Quelles sont les idées de mes administrés sur un point précis lors d’une concertation ?
Toutes ces questions peuvent être étudiées grâce à la statistique textuelle. Au-delà des mesures, ces outils permettent de naviguer et de fouiller les recoins de grands ensembles de textes. Plus qu’un simple enseignement d’outil, cette formation vous permettra d’entrer dans la fouille de données textuelles. L’objectif final sera que vous puissiez naviguer dans vos données en fonction des besoins de votre entreprise ou institution. Les outils utilisés sont tous gratuits et sous licence open source, ce qui signifie que les stagiaires repartiront avec les outils installés et seront directement opérationnels, sans avoir besoin de licences payantes.
- Introduction aux Statistiques Textuelles et Types de Données
- Définitions des statistiques textuelles et des différents types de données.
- Du texte et des données, approche complémentaire des discours et des données que l’on peut leur associer (âge, région…)
- Les Statistiques Textuelles Appliquées
- Présentation des méthodes statistiques utilisées dans l’analyse textométrique (spécificités, classification…)
- Exemples pratiques pour illustrer l’application des différents types de statistiques textuelles.
Après-midi (13h30 – 17h00)
- Présentation d’IRaMuTeQ – Installation et Importation des Données
- Guide d’installation et configuration d’IRaMuTeQ.
- Importation de différents types de données textuelles dans IRaMuTeQ.
- Exploration d’IRaMuTeQ – Interface et Premiers Pas
- Prise en main de l’interface d’IRaMuTeQ.
- Démonstration des fonctionnalités clés pour explorer les corpus.
Jour 2: Classification Reinert, Spécificités et Similitudes théories et applications
Matinée (9h00 – 12h00)
- Classification Reinert – Concepts et Méthodologie
- Présentation des étapes de la classification Reinert.
- Variation des corpus et des paramètres de la classification
- Prise en Main de la Classification Reinert avec IRaMuTeQ
- Application pratique de la classification Reinert avec IRaMuTeQ.
- Analyse des résultats et interprétation des classes identifiées.
Après-midi (13h30 – 17h30)
- Activités pratiques guidées
- Application des méthodes avec des exemples pratiques
- exploration libre, aidée par la formatrice
- Fin des explorations, bilan et réponses aux questions
Les stagiaires devront venir avec un ordinateur portable, durant la formation, les outils seront installés et des corpus d’entraînements seront proposés. À la demande des stagiaires et après vérification de la faisabilité, le stagiaire pourra apporter son propre corpus pour s’entraîner.
mots-clés : lexicométrie, textométrie, logométrie, fouille de données, text-mining
Modalités pédagogiques
- Documents supports de formation projetés
- Exposés théoriques
- Etude de cas concrets
- Mise à disposition en ligne de documents supports à la suite de la formation
Evaluation des résultats
- Mises en situations
- Formulaires d'évaluation de la formation
Accessibilité aux personnes en situation de handicap
Veuillez faire connaître vos besoins au plus tôt lors de nos échanges. La prise en compte d'un besoin spécifique peut nécessiter un délai pour étudier les modalités d'adaptation ou d'orientation.
Taux de satisfation des stagiaires
Taux d'abandon
Taux de retour des enquêtes
de 6 à 12 stagiaires
savoir utiliser un ordinateur, avoir les droits de gestionnaires sur son ordinateurs.