Le Machine Learning est-il magique ?

Le Machine Learning ne fait pas tout. Face à un problème avec de grandes quantités de données, la première chose à faire consiste à bien comprendre l’étendue du problème et à connaître précisément ses données. Un modèle de Machine Learning est un outil puissant qui participe à la résolution, mais il s’agit rarement de la solution. Dans de nombreux scénarii,une solution fondée uniquement sur un modèle de machine learning ne fournira pas une réponse robuste. Dans cet article, nous présentons quelques techniques pour combiner intelligemment un modèle prédictif de Machine Learning avec des étapes de post-traitement sur les prédictions du modèle.  

 

 

Introduction

 

Le Machine Learning a vu, ces dernières années, un développement extrêmement rapide et son utilisation s’est largement popularisé. Il est parfois considéré comme une formule magique qui permet de résoudre toutes les problématiques impliquant de gros volumes de données. L’efficacité des modèles de Machine Learning n’est plus à démontrer mais on oublie souvent que leur performance est conditionnée par une compréhension fine du problème à résoudre.

Certains problèmes peuvent en effet se révéler difficile à exprimer sous la forme d’un pur problème de machine learning. Il peut notamment être trop coûteux / impossible d’obtenir des données labellisées, rendant caduque les techniques d’apprentissage supervisées. Les méthodes d’apprentissage non supervisées peuvent aussi ne pas être du tout applicable au problème. Dans ce cas il peut être judicieux de reformuler le problème en un problème intermédiaire, souvent plus général et pour lequel les techniques de Machine Learning seront pertinentes et efficaces. Puis appliquer une étape de post-processing sur les prédictions du modèle pour répondre précisément au problème posé.

Le post-processing consiste à effectuer un traitement sur les prédictions produites par un modèle. C’est une étape souvent négligé alors qu’elle est toute aussi importante que celle du feature engineering ou d’élaboration du modèle. Le post-processing permet de s’assurer que les prédictions  sont cohérentes et que l’erreur de prédiction du modèle reste raisonnable. Il permet aussi de corriger des biais inhérents à un modèle et aux choix dans la modélisation. Un post-processing intelligent peut enfin permettre une interprétation automatique des prédictions et leur transformation pour les rendre plus intelligibles et exploitables.

 

Share This