data scientist

Et si vous deveniez data scientist ?

Emmanuel Jakobowicz Mis à jour le : 13 mai 2016 actualités 2 Comments

Comme beaucoup, vous rêvez de devenir data scientist. Une fois que vous l’avez dit vous vous retrouvez face à un mur vertigineux et une première question périlleuse : un data scientist, c’est quoi ?

Vous avez fait le tour des sites d’annonces pour voir ce qu’attendent les recruteurs et vous n’avez pas été bien avancé. Chaque annonce demande des compétences différentes et il serait totalement illusoire de croire que vous pouvez devenir expert en tout : R, python, Java, Hadoop, Spark, MapReduce… et il s’agit là uniquement de la partie technologique.

Depuis quelques années, je me retrouve très fréquemment face à des professionnels (je ne parlerai pas dans cet article des étudiants qui ont maintenant des cursus complets pour devenir data scientist) qui me pose la même question : je ne veux pas rater le virage vers la data et je veux être attirant pour mes futurs employeurs, que dois-je apprendre ?

Si la réponse à cette question était simple, on trouverait aujourd’hui des data scientists de toutes parts avec les compétences adéquates.

Qu’est-ce qu’un data scientist ?

La définition du data scientist est en constante évolution. Les premières définitions de ce métier, censé être le plus sexy du monde, étaient totalement idéalisées, on demandait aux data scientists d’être à la fois :

  • des informaticiens chevronnés pour mettre en place des infrastructures complexes
  • des statisticiens modernes connaissant tous les algorithmes de machine learning
  • des programmeurs hors pair pouvant s’adapter à un nouveau langage en quelques jours
  • des analystes business avertis connaissant tous les rouages du business
  • des chercheurs prêts à découvrir de nouveaux algorithmes pour gagner des parts de marché

Bien entendu, ce mouton à cinq pates est une chimère et finalement uniquement quelques Chief Data Scientists peuvent se targuer d’avoir une vision complète de tous ces domaines.

On en vient donc à une définition plus abordable du data scientist d’aujourd’hui.

Le data scientist doit maîtriser les langages de la data science afin de mettre en place conjointement avec des équipes métiers des stratégies pour extraire le plus d’informations possibles des données. L’exigence pour satisfaire cette définition reste importante mais les compétences sont alors différentes :

  • maîtriser les langages de la data science : être à l’aise avec les méthodes de machine learning et leur utilisation opérationnelle, être capable de mettre en place des prototypes et aider les équipes techniques à la mise en production.
  • avoir des qualités de collaboration et de vulgarisation : il faut être en contact permanent avec toutes les équipes de votre entreprise et être capable de les motiver et de leur expliquer clairement les concepts, les principes et les forces des approches à mettre en place.
  • avoir des qualités de mise en valeur : la data science est souvent un domaine nouveau dans les entreprises et on sait que la nouveauté peut faire peur. Le data scientist doit donc savoir rassurer et connaître précisément les besoins et les résultats attendus.

Mais par où commencer ? Commencez par réfléchir à ce que vous savez déjà faire, je suis sûr que vous êtes déjà sur la bonne voie pour devenir un data scientist. Et surtout, n’oubliez pas que c’est par l’expérience qu’on acquiert le plus de connaissances.

Comment devenir data scientist ?

On ne devient pas data scientist du jour au lendemain. On peut bien sûr suivre un cursus complet et sortir avec un beau diplôme mais le meilleur moyen de devenir data scientist est d’utiliser ses compétences et d’en acquérir de nouvelles au cours de votre carrière.

Si vous êtes un professionnel et que vous lisez cet article, il y a beaucoup de chance que vous soyez déjà lié au monde de la data : data analyst, business analyst, chargé d’études, spécialiste BI… Dans ce cas, vous avez déjà une culture data et quelques compétences supplémentaires vous permettront d’évoluer vers le métier de data scientist.

La première compétence réside dans la connaissance des fondamentaux de la data science :

  • les fondamentaux du big data, il s’agit ici de maîtriser tous les nouveaux concepts liés au traitement des données massives, comprendre les technologies et les infrastructures, être capables d’échanger sur ces sujets et de choisir la bonne technologie pour le bon cas d’usage. Se former à ces concepts est important mais une certaine pratique apporte encore plus de connaissances.
  • le machine learning, les techniques d’analyse et de traitement des données évoluent rapidement, aujourd’hui le machine learning (apprentissage automatique) est le centre de toutes les attentions. Maîtrisez ces algorithmes et vous pourrez très rapidement les appliquer.
  • les langages de programmation, l’une des questions récurrentes est la suivante dois-je privilégier R ou python ? Aujourd’hui ces deux langages sont la pierre angulaire de la data science, votre choix doit se faire en fonction de vos aspirations : R est extrêmement efficace pour faire des analyses approfondies et utiliser des méthodes novatrices alors que python est un langage de prototypage très performant avec des bibliothèques très variées. Un data scientist qui n’a pas de bases en R peut difficilement se définir comme un data scientist. Python est un plus indéniable car il permettra d’échanger plus facilement avec les programmeurs (non data scientists). Les autres langages de la data science sont SQL et scala qui apportent une vraie plus-value à votre profil.

Si vous possédez déjà une bonne partie de ces compétences qui s’acquièrent à la fois par des formations mais aussi par la pratique, vous serez sur la bonne voie pour devenir un data scientist accompli.

Alors une seule solution, au boulot ! Suivez nos formations, lisez nos articles et expérimentez !

Contactez-moi si vous avez besoin de conseil à l’adresse ej@stat4decision.com et n’hésitez pas à apportez votre point de vue en commentant cet article.

Partager cet article

Comments 2

  1. Bonjour
    Je cherche justement une formation intensive et en présentiel en data science merci de me préciser vos prochaines dates et les couts relatifs

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.