Formation analyse textuelle avec python
Maîtrisez le traitement du langage (NLP) avec Python (2 jours)
Prochaines sessions :
12 et 13 novembre 2024 à Paris et à distance
Formation analyse textuelle avec python aussi disponible dans vos locaux (sur demande)
A propos
Pour les utilisateurs de Python en data science, le traitement du langage (NLP) est un domaine de premier plan.
Cette formation analyse textuelle avec python se décompose en deux parties : une présentation des principes du NLP et des outils de traitement des chaînes de caractères avec python et une étude plus approfondie des packages spécialisés avec notamment nltk et les packages de text mining.
Formation en petits groupes (jamais plus de 6 participants) en présentiel ou à distance basée sur des cas pratiques de traitement de données textuelles.
Le programme
Objectis
- Maîtriser les outils pour traiter des données textuelles avec python
- Identifier la problématique et les outils à utiliser pour traiter des problèmes de NLP
- Mener à bien un projet de traitement NLP avec Python
Organisation des journées
Durant ces journées, nous nous concentrons sur des applications pratiques pour maîtriser l'analyse textuelle avec python.
Détails du programme :
Les principes de l’analyse textuelle
- Qu'est-ce que le traitement du langage naturel (NLP) ?
- A quelles questions répond le NLP ?
Les outils de python pour le NLP
- Le travail sur les chaînes de caractères avec python
- string
- expressions régulières
- transformation vectorisées dans des DataFrame
- Les API pour récupérer des données textuelles
- Réseaux sociaux
- Web scrapping
- Open Data
- La préparation des données textuelles en fonction de la problématique
- Données d'enquêtes
- Automatisation de processus
Le NLP avec nltk et spaCy
- Les packages nltk et spaCy : leurs principes et leurs différences
- Applications avancées de nltk et spaCy pour du traitement du langage
Vers le text mining : combiner nltk et des algorithmes de machine learning
- Identification de thématiques à partir de textes (topic modeling)
- Classifieurs Bayésien
- L’utilisation de nltk et du machine learning avec scikit-learn pour l’analyse des sentiments
L'utilisation du deep learning pour le NLP
- Utilisation de keras pour construire un premier réseau
- Les possibilités pour le traitement du langage avec le deep learning
Les outils
Lors de cette formation, nous utiliserons Anaconda, python 3, SpaCy et nltk .
Un serveur JupyterHub sera mis à disposition des apprenants pour manipuler sans avoir à installer d'environnements avancés.
Profils :
- Data scientist désirant s'initier au traitement des données textuelles
Prérequis :
- Connaissance le langage python et le traitement des données ou ayant suivi la formation python pour la data science.
Besoin de conseils ou d'informations, contactez-nous au 01.72.25.40.82
Inscription
Tarif inter-entreprises : 1100 euros HT par participant (pour 2 jours)
- Réductions disponibles pour les financements personnels, les étudiants et en cas d'inscriptions multiples
- Nos tarifs sont HT et n'incluent pas les déjeuners
- Tarif intra-entreprise (sur mesure, selon vos besoins) : nous contacter pour évaluation
Inscription et demande d'informations
Veuillez remplir le formulaire ci-dessous pour vous inscrire, obtenir un devis ou des détails sur la formation proposée.
Toutes nos formations peuvent être prises en charge par l'ensemble des OPCO grâce à notre référencement DataDock et à notre certification Qualiopi.
Cette formation est disponible en session sur mesure organisée dans votre structure pour un groupe allant jusqu'à 8 participants. Contactez-nous pour organiser une session.
Partager cette page