Dimanche 29 Novembre, 2020

Data Science, Big Data: plus que des mots branchés, une opportunité réelle pour les écoliers et universitaires en Haïti

Grégory PINCHINAT
Statisticien / Economiste
Data Scientist/ Photos: Steven Aristil

Grégory PINCHINAT Statisticien / Economiste Data Scientist/ Photos: Steven Aristil

Data Science, Big Data: plus que des mots branchés, une opportunité réelle pour les écoliers et universitaires en Haïti

Tout comme l’Inde a pu produire des jeunes qui innovent en Informatique, nous osons croire que les jeunes Haïtiens peuvent devenir des références en ce qui a trait au traitement des données. La Data Science étant nouvelle et très convoitée, à la fois par les professionnels que par les organisations, représente une opportunité réelle dont les écoliers et les universitaires haïtiens peuvent profiter. Quel que soit le domaine de l’étudiant ou du professionnel, il peut se convertir en Data Scientist, pourvu qu’il le désire et pour autant qu’il possède ou puisse acquérir rapidement les pré-requis indispensables.

La Data Science : toute jeune mais déjà plus sexy que ses parents!

La Data Science est l’enfant de deux disciplines : la Statistique et l’Informatique. La Statistique est un ensemble de méthodes qui ont pour objet la collecte de données le plus souvent brutes, leur stockage, leur traitement et leur diffusion sous forme d’information exploitable. La Statistique se fait soit à la main, soit à l’aide de logiciels dont les fonctions sont fixées. Tandis que l’Informatique ( « information » + « automatique »), est par définition la science du traitement de l’information par des calculs automatiques.

Commençons par mettre certaines choses au clair, parce que le genre au niveau de la langue française peut être sujet aux polémiques! Quand je me réfère à la Data Science comme étant un enfant, je garde « enfant » au masculin. Petite explication… La forme masculine d’ « enfant » est en réalité neutre. L’on concevra que ladite profession reste sexy quel que soit le sexe qu’on veut bien lui attribuer, et selon que la ressource humaine qui
l’adopte préfère la voir comme un mâle ou bien comme une femelle.

Ses parents (l’Informatique et la Statistique) ne sont pas sœurs mais sont cousines, car ils ont un ancêtre commun mais non direct : la Mathématique. En continuant avec ce raisonnement logique, mais surréaliste, on peut aisément déterminer le sexe de ces dernières. Gardons un esprit ouvert, et disons-nous que chacune de ces sciences peuvent être bisexuées, c’est-à-dire qu’ils jouent alternativement un rôle de père ou de mère selon la nature de ce qu’ils engendrent comme application dans la vie réelle.

Perso, j’aime bien voir la Statistique comme la maman, parce qu’elle porte l’œuf qui va éclore pour devenir poussin. Et l’Informatique est automatiquement papa, puisqu’il joue le rôle de fécondateur, qui va transformer l’œuf de la Statistique en une entité plus vivante : la Data Science. La Data Science est en effet ce qu’on fait quand on utilise des outils de la Science Informatique en vue de :

  • Diversifier et d’automatiser les lois de probabilité et les processus de simulation statistique;
  • Faire ressortir des relations a priori insoupçonnées entre diverses réalités;
  • Dépasser la puissance de calcul du Statisticien en le permettant de traiter de manière efficace et efficiente tout type et tout format de données brutes;
  • De perfectionner et de généraliser (dans une certaine mesure) les méthodes de collecte, de traitement, de visualisation, de modélisation, de prévision et de production d’information accessible et directement exploitable.

 

La Data Science et les Big Data

La Data Science utilise des jeux de données simples et minimaux au sein d’une petite ou moyenne entreprise et dans un contexte d’usage strictement personnel. Mais cette science trouve toute sa raison d’être dans l’exploitation des Big Data au sein des grandes organisations. Entre autres : les opérations des grandes entreprises, la gestion de la société et de l’environnement, ainsi que les activités des utilisateurs de nouvelles technologies génèrent ce qu’on appelle des « Données Massives ». En anglais, et dans le jargon technique en français, on les appelle : les Big Data. Il est difficile de les définir mais on les caractérise à partir de leurs 4V, c’est-à-dire :

  • Leur volume : il s’agit en général d’une quantité de données tellement massive que les méthodes traditionnelles de la Statistique et les logiciels-tableurs (tels que Excel) ne permettent pas facilement d’en tirer des informations claires et rationnelles. Exemple : les photos de profil des 1.82 milliards d’utilisateurs journaliers de Facebook.
  • Leur vélocité ou vitesse de traitement : Les Big Data sont générées à un rythme époustouflant et il faut non seulement avoir de l’espace pour les stocker, mais il faut pouvoir les traiter également au moins aussi vite qu’ils sont générés. Exemple : Des millions d’utilisateurs chargent des photos sur facebook, et la plateforme doit pouvoir détecter automatiquement s’il y a des personnes sur ces photos et suggérer des identifications à tous ces utilisateurs rapidement.
  • Leur variété : Ils proviennent de plusieurs sources (Facebook, Twitter, Google, une entreprise multinationale, mon blog…) et peuvent être de n’importe quelle nature (photo, vidéo, chiffres, lettres, dates, codes-barres, empreintes manuelles, empreintes vocales, empreintes oculaires…).
  • Leur valeur : Les entreprises sont prêtes à payer cher à la fois pour des Big Data brutes que pour les informations qui peuvent en être tirées après traitement. La raison est simple : celui qui possède beaucoup d’information fiable peut prendre des décisions effectives et peut contrôler son domaine ainsi que les acteurs qui y sont impliqués.

La « Data Science » et ses métiers : les plus sexy au XXIème siècle!

De façon générale, tous ceux qui ont étudié et qui travaillent dans un domaine de la Data Science sont des « Data Scientists » (en français : « Scientifique des Données », en créole : « Syantifik Done »). Mais la qualification de « Data Scientist » peut dépendre de leur position au sein de l’entreprise ou de l’organisation. Il y existe plusieurs spécialisations. Dans le milieu du travail, on distingue principalement :

  • Le Data Engineer (Ingénieur de Données / Enjenyè Done), qui s’occupe de l’administration de la base de données d’une grande entreprise, de l’acquisition et de la mise en disponibilité des données pour que le Data Analyst puisse faire son travail aisément. Dans une petite entreprise, on l’appelle plus simplement un « Administrateur de Base de Données ».
  • Le Data Analyst (Analyste de données / Analis Done) qui est assez souvent un Data Scientist débutant, ou spécialisé dans divers types d’analyses. Il sait utiliser des logiciels ou des langages de programmation pour exploiter des données déjà disponibles ou facilement récupérables pour permettre la prise de décision immédiate ou régulière.
  • Le Data Scientist (Scientifique des Données / Syantifik Done), qui s’occupe et coordonne globalement toutes les opérations relatives aux données que possède une entreprise. Il a une connaissance plus profonde à la fois des aptitudes d’un Data Analyst et d’un Data Engineer. Il maitrise aussi un plus large éventail de méthodes de traitement de données et de production d’information intelligible.

Les organisations et les entreprises ont autant besoin des Big Data qu’elles ont besoin des Data Scientists. Puisque les Big Data peuvent créer de la valeur, on dit qu’elles ont de la valeur. Puisque les Data Scientists sont les seuls qui savent décoder l’information cachée au sein des Big Data, les Data Scientists sont aussi précieux. Et finalement puisque la Data Science n’est pas très pratiquée et reste encore très peu enseignée à l’école et dans les universités, elle est par conséquent très demandée sur le marché du travail. Le fait que cette science soit nouvelle et en plein essor, on dit qu’elle est attirante ou « hot ». Les initiés du domaine l’appellent « la profession la plus sexy du XXIème siècle! ».

Comment peut-on intégrer le domaine?

Si on veut intégrer le domaine de la Data Science et y progresser, on a besoin d’une bonne base en Mathématiques (surtout en : Probabilité, Statistique descriptive, Statistique inférentielle est un plus, Algèbre Linéaire, Optimisation en Analyse mathématique) et d’un peu d’anglais. Initié à la programmation informatique, on sera plus à l’aise, mais ce n’est pas nécessaire. Certains programmes d’étude débutent avec les pré-requis, mais ils ne sont pas toujours exhaustifs : il faudra de toute façon que l’on complète ces connaissances élémentaires soi-même de son côté.

Par ailleurs, la Data Science se fait exclusivement avec la programmation informatique, donc il faut s’assurer de savoir tout au moins comment utiliser basiquement un ordinateur : l’allumer, l’éteindre, ouvrir une application et l’utiliser, se connecter à internet pour faire une recherche, etc…). Il existe des cursus qu’on peut compléter en ligne, la différence entre ces cursus résidant dans leur niveau et dans la certification qu’ils offrent : certificat professionnel, diplôme, master, etc. Les universités qui offrent une orientation vers la Data Science sont rares, souvent chères et les cours se font presque toujours en partenariat avec une grande entreprise qui s’est déjà développé dans le domaine, comme Google, Amazon, Facebook, IBM, Oracle, entre autres.

On peut très facilement devenir Data Scientist en Haïti grâce à Ayiti Analytics (site web : www.ayitianalytics.org / page Facebook : www. https://www.facebook.com/ayitianalytics/ ). En effet, Ayiti Analytics est une firme haïtienne qui offre des cours en présentiel et en ligne, en créole et en anglais. Pour commencer à suivre les cours, vous devriez avoir un laptop. Mais selon le programme disponible, il se peut également que les responsables mettent à votre disposition un laboratoire informatique. Vous avez, par ailleurs un tuteur qui vous guide dans vos études, en créole et en anglais.

Rémunération d’un Data Scientist

Le pratiquant d’un de ces métiers au niveau international (Etats-Unis, Canada, Europe…) peut espérer gagner un salaire mensuel compris entre 5.000 et 15.000 dollars US. Rondelette petite somme qui peut améliorer les conditions de vie du professionnel. Néanmoins, en Haïti, ce salaire est beaucoup moins satisfaisant et peut être compris entre 900 et 3000 dollars US par mois. Cependant, cela peut varier en fonction du poste occupé, du niveau de qualification et de l’expérience (richesse du portfolio).

Par ailleurs, certaines organisations offrent bien moins que 900$ dans notre pays. Ces dernières risquent alors soit de ne pas trouver des Data Scientists de haut niveau, soit de trouver des Data Scientists qualifiés qui ont besoin d’un salaire et d’un bureau dont ils pourront utiliser la connexion internet pour chercher un boulot qui paie mieux ailleurs! Sur le marché haïtien, les bons Data Scientists sont attirés en moyenne par un job qui est dans la fourchette des 1000-1500$ par mois.

Mieux l’entreprise ou l’organisation est prête à rémunérer, plus elle devient attirante et sexy aux yeux des Data Scientists! On comprend dès lors pourquoi, ces professionnels, à un certain niveau, deviennent beaucoup plus attentifs aux offres d’emploi internationales : ces dernières sont de tout point de vue beaucoup plus intéressantes que celles du marché national qui peine encore à intégrer et à valoriser cet actif qu’est la Big Data, et les ressources humaines qui s’adonnent à son exploitation et à son analyse.

Grégory PINCHINAT
Statisticien / Economiste
Data Scientist

Recevez gratuitement les dernières nouvelles d'Haïti et d'ailleurs directement sur votre téléphone en téléchargeant l'App de Loop News :