fbpx

Umojahack 2022 : Rencontre Emmanuel Koupoh data-scientiste, ambassadeur Zindi

Umojahack 2022 : Rencontre Emmanuel Koupoh data-scientiste, ambassadeur Zindi

Les 19 mars et 20 mars derniers a eu lieu la 3ème édition de l’Umojahack-Africa, hackathon inter-universitaire virtuel d’intelligence artificielle ouvert aux étudiants de toute l’Afrique organisé par la plateforme de concours Zindi. Pendant 2 jours, les étudiants d’universités, d’instituts ou d’écoles de formation à la science des données répartis sur tout le continent, se sont affrontés afin de trouver des solutions d’apprentissage automatique (Machine Learning) à des problèmes concrets.

Emmanuel Koupoh, enseignant au DIT (Dakar Institute of Technologies), data-scientiste à Bamtu et ambassadeur Zindi au Sénégal,  qui a déjà participé et remporté des challenges Zindi,  revient sur son expérience de cette compétition, sur ce qu’elle lui a apporté et sur la meilleure façon dont il faut l’aborder.

Cette année les data scientistes ont planché sur la qualité de l’air en Ouganda (débutants);  sur des  prévisions en assurance au Zimbabwe (intermédiaires) et sur  la confection d’anti-venin (avancés). La prime de 10 000 $ a été répartie entre les 3 vainqueurs des 3 catégories.

Emmanuel. Koupoh, datascientiste et ambassadeur Zindi à Dakar © DR

Comment as-tu connu Zindi?

J’ai connu Zindi un peu par hasard. C’était pendant l’année scolaire de 2018- 2019, j’étais à ESATIC à Abijdan, en troisième année de SIGL (Systèmes Informatiques et Génie Logiciel). Un ami m’a envoyé le lien de la plateforme. Nous avons trouvé que ça pouvait nous permettre de progresser. Donc nous nous sommes inscrits et nous avons commencé à participer à  plusieurs challenges. Comme j’avais déjà fait du Deep-Learning, je choisissais des compétitions orientées dans ce domaine. A l’époque,  j’avais peu de pratique des données tabulaires et je galérais beaucoup avec les datasets.

C’est quand je me suis inscrit au DIT (Dakar Institute of Technology), en datascience, que j’ai pu m’attaquer plus facilement à des challenges orientés Machine Learning et basés sur le traitement et sur l’analyse de données.  C’est comme  cela que j’ai remporté le “Umojahack-Africa Expresso” challenge en 2020. Ça consistait à prédire le  nombre d’ abonnés qui allaient quitter le réseau de la compagnie de téléphone.

 

Celina Lee SEO de Zindi

Lors de la remise des prix de l’UmoJahack 2020   © DR

Qu’est ce que tu trouves d’intéressant dans ces concours?

Déjà pour la pratique ça permet de se comparer aux autres. Quand tu passes deux semaines à travailler sur un modèle et que tu vois que tu n’es que 100ème au classement, tu te poses des questions. Tu vas chercher des solutions pour améliorer ton score.  Tu te rends compte rapidement que pour être dans le haut du classement,  il faut plus qu’un simple Random Forest  et qu’il faudra travailler sur plusieurs algorithmes pour entraîner ton modèle.  On apprend également à travailler avec les notebooks des autres, à comparer les modèles, à les combiner. En fait, tu cherches tout le temps à améliorer ton classement et quand tu tombes sur une compétition qui t’intéresse, tu n’arrêtes plus.

Donc participer à ces challenges t’ont permis d’engranger de l’expérience.

Oui, là encore une expérience pratique. Car les données utilisées pour les compétitions proviennent de véritables compagnies, la plupart du temps africaines, et  qui sont confrontées à des problèmes concrets. De plus, d’un point de vue personnel, on peut réutiliser les données. Par exemple pour écrire un  mémoire,  dans le cadre d’un travail universitaire. Moi j’ en ai utilisé  pour faire le pre-training d’un model en attendant d’avoir les données réelles. Et c’est très important car nous n’avons pas beaucoup de données à notre disposition. Collecter des données,  les traiter,  les labéliser ça prend du temps et de l’argent.  Et Zindi prend le temps de nettoyer et de classifier les données mises à notre disposition.

Tu cherches tout le temps à monter au classement et quand tu tombes sur une compétition qui t’intéresse, tu n’arrêtes plus.

En dehors de l’aspect compétition, est-ce que participer à un challenge peut offrir des opportunités ?

Déjà, ça permet d’être en relation avec d’autres datascientistes. Et oui,  Zindi met de plus en plus l’accent sur l’accompagnement des  datascientistes dans la recherche d’emploi. Depuis plus d’un an,  il y a une section jobs avec des annonces.  Tout récemment, Zindi a lancé une compétition Trail-Blazzers. En gros, les compétiteurs qui arrivaient à dépasser un score de référence pouvaient bénéficier d’une formation afin d’améliorer leur CV et étaient prioritaires pour  les offres d’emplois proposées par Zindi.

Et puis il y a le système des ambassadeurs. On peut gérer une communauté, échanger avec le staff des ambassadeurs. On vous propose de faire des présentations ou de produire du contenu sur le blog de la plateforme etc. En gros, tant de  choses qui te permettent d’apprendre ton métier.

As tu des conseils donner à ceux qui. vont s’attaquer pour la 1ère fois à l’Umojahack de samedi?

Avant tout il faut garder la tête froide. C’est à dire ne pas partir dans tous les sens. Prendre le temps de bien comprendre les jeux de données qui sont proposés et commencer à partir d’un plan solide. De plus je consieillerai aux candidats de faire les challenges de training que Zindi a mis à disposition Ils   correspondent aux différents niveaux et servent de simulation. Moi en tant qu’ambassadeur j’essaie d’aider  à se préparer ceux qui veulent se lancer.  Je partage des starters notebook ou j’organise des présentation pour expliquer ce à quoi ils auront à faire.

Mais au départ l’essentiel c’est de lancer sans appréhension car, de toutes façons, on  a rien à. perdre. Au contraire.