L'état d'esprit de l'IA : Rapprocher les perspectives de l'industrie et de l'université

6 minutes de lecture

À terme, toutes les organisations devront tirer parti de l'apprentissage automatique pour rester compétitives. Tout comme le passage aux applications web, aux applications mobiles et au site cloud, l'apprentissage automatique sera la norme, et non l'exception, d'une pile technologique moderne.

Si l'intelligence artificielle et la technologie de l'apprentissage automatique font l'objet d'un battage médiatique important, il existe également une réalité très prometteuse qui consiste à augmenter le développement de logiciels conventionnels avec des logiciels qui apprennent à partir d'activités et qui peuvent réagir de manière appropriée, et ce d'une manière qui n'est pas réalisable avec un codage standard. Cependant, le processus de développement d'une technologie d'apprentissage automatique efficace est très différent du développement de logiciels classiques et nécessite donc une approche et un état d'esprit différents. Cet état d'esprit consiste à reconnaître que le développement de l'apprentissage automatique est en grande partie un processus scientifique plutôt qu'un processus de développement logiciel. C'est ce que j'appelle l'état d'esprit de l'IA.

Intelligence artificielle et apprentissage automatique : Quelles sont les différences ?

Pour mémoire, mon point de vue sur la terminologie est que l'intelligence artificielle (IA) est "aspirationnelle" et que l'apprentissage automatique (AAM) est "pratique". En d'autres termes, la majeure partie de ce que tout le monde appelle l'IA aujourd'hui est en réalité de l'apprentissage automatique. On espère que les progrès de la recherche et des techniques d'apprentissage automatique nous permettront de nous rapprocher d'un logiciel qui ressemble à une véritable intelligence humaine, mais la question de savoir si nous y parviendrons un jour est très discutable. Néanmoins, les initiatives qui relèvent de l'IA sont réelles et peuvent aider les entreprises à améliorer l'expérience de leurs clients et à rationaliser les processus critiques.

Toutes les parties prenantes d'un projet de ML doivent comprendre l'état d'esprit de l'IA afin d'avoir une compréhension commune des ressources nécessaires, des mesures de progrès et des réalités de ce qui est pratique avec les techniques actuelles de ML. Il y a des raisons pour lesquelles le monde universitaire et l'industrie existent séparément et servent des objectifs différents. Au début, les grandes entreprises ont vu la valeur de l'approche scientifique et ont financé des laboratoires de recherche essentiellement autonomes tels qu'IBM, Xerox et DEC. Aujourd'hui, la plupart des entreprises ne peuvent pas financer un laboratoire de recherche entièrement distinct dans l'espoir que certains des résultats soient produits. Mais les avantages potentiels de la ML et les conséquences de ne pas l'adopter exigent que les entreprises abordent cette technologie différemment.

Qu'est-ce qu'un état d'esprit en matière d'IA ?

Comme nous l'avons évoqué plus haut, l'état d'esprit de l'IA fait le lien entre les perspectives de l'industrie et celles des universités. Ayant chevauché les mondes de l'université et du secteur privé, je suis bien placé pour parler de l'utilisation d'une approche hybride. Au cours des 20 dernières années, j'ai fait de la recherche et enseigné l'informatique à l'université de San Francisco (USF). Je suis également le scientifique en chef de SnapLogic, où je travaille sur la recherche prospective plateforme et dirige le programme d'apprentissage automatique.

Mon premier projet chez SnapLogic durant l'été 2010 était un projet d'apprentissage automatique dans lequel j'ai développé des techniques statistiques pour apprendre les correspondances de noms de champs afin que les futures correspondances de champs puissent être prédites. J'ai passé la plupart de mon temps à comprendre les données, à spécifier une représentation et à mener des milliers d'expériences pour valider le modèle. J'ai généré des centaines de rapports et de visualisations de données afin de me convaincre et de convaincre les autres du bien-fondé de l'approche. Le projet de recherche a été couronné de succès et a ensuite été ajouté au produit.

Cinq ans plus tard, j'ai commencé à explorer de nouveaux domaines d'application de la ML dans les produits. J'ai travaillé avec des étudiants diplômés de l'USF pour étudier les recommandations et l'analyse des sentiments. En fin de compte, nous avons réussi à faire des recommandations, ce qui a donné naissance à la technologie de l'assistant d'intégration d'iris. Aujourd'hui, l'équipe ML continue de trouver des moyens d'améliorer l'expérience de l'utilisateur grâce à l'application de la technologie ML.

Plus qu'un simple logiciel

Mon double rôle d'universitaire et de scientifique en chef m'a permis d'appliquer une mentalité de chercheur dans un cadre industriel.

L'un des aspects les plus importants de l'état d'esprit de l'IA est la reconnaissance du fait que le développement d'une technologie de ML efficace n'est pas comparable à la mise en œuvre d'une fonction logicielle. Alors que nous disposons d'assez bonnes stratégies pour estimer le coût du codage conventionnel, il est plus difficile d'estimer le temps nécessaire pour réussir ou pour réussir tout court, en raison de l'incertitude qui entoure le développement de la ML. Si le ML n'est en fin de compte qu'un logiciel, la manière dont il est construit repose sur l'apprentissage à partir de données historiques observées. L'astuce consiste à trouver les bonnes données historiques, la bonne version préparée des données et le bon algorithme de ML. Cependant, trouver la bonne combinaison nécessite un processus itératif qui englobe le profilage des données, la préparation des données, la sélection des algorithmes, la configuration des algorithmes, l'expérimentation et l'évaluation.

Ce processus itératif est essentiellement une application de la méthode scientifique et toutes les personnes impliquées dans un projet de ML doivent comprendre l'incertitude de ce processus. Au début, envisagez d'établir des jalons basés sur les ensembles de données utilisés, les caractéristiques sélectionnées et les algorithmes de ML employés. Même si cela ne vous permettra pas d'obtenir un meilleur délai, cela aidera tout le monde à comprendre les progrès réalisés. Il se peut qu'un problème de ML particulier nécessite trop de temps et d'efforts, ou qu'il ne soit pas techniquement réalisable à l'heure actuelle.

Une fois que vous aurez suivi le processus plusieurs fois, vous et votre équipe serez peut-être en mesure de mieux estimer l'effort de développement du ML si une nouvelle initiative partage certains aspects de vos premiers projets. Cependant, les nouvelles applications de ML nécessiteront le même processus expérimental.

Le point de vue de l'industrie

Bien que j'aie soutenu que l'industrie doit adopter une approche plus académique de l'apprentissage automatique, il existe des pratiques industrielles qui peuvent être mises à profit pour contribuer à la réussite des projets d'apprentissage automatique. Le plus important est de comprendre le problème, le "cas d'utilisation". Les universitaires ont souvent du mal à définir un problème ou à résoudre des problèmes qui ne sont pas utiles. Les projets de ML peuvent grandement bénéficier d'objectifs ou de résultats bien définis. Dans le cas du ML, les résultats peuvent être initialement hors de portée, mais le fait d'avoir un bon objectif au départ aidera à faire avancer le projet dans la bonne direction. Le résultat initial peut être révisé au fur et à mesure que l'on acquiert des connaissances sur les limites des données et des algorithmes.

Fixer une limite de temps à un projet est raisonnable et nécessaire dans un contexte industriel. Certains universitaires peuvent passer des années sur un problème de recherche spécifique. La plupart des entreprises n'ont pas le luxe de soutenir des initiatives de recherche totalement illimitées. Une limite temporelle peut donc limiter les coûts, mais elle ne garantit pas la réussite d'un projet. Au lieu de cela, un projet de ML devrait avoir des résultats supplémentaires qui peuvent être utiles à l'organisation et aux futures initiatives de ML. Si vous pouvez définir ces résultats supplémentaires dès le départ, un projet de ML peut être couronné de succès sans qu'une implémentation complète de ML soit nécessaire. Par exemple, de nombreuses données opérationnelles ne sont pas bien documentées. Une partie du processus de ML pourrait consister à fournir une explication du schéma opérationnel actuel et de son utilisation.

Le meilleur des deux mondes

J'ai eu beaucoup de chance d'appliquer ma mentalité et ma sensibilité universitaires dans un cadre industriel à SnapLogic. J'encourage d'autres entreprises et professeurs à créer des collaborations similaires qui permettent aux professeurs de travailler à temps partiel et d'impliquer les étudiants dans la recherche. En particulier dans le monde de la ML, l'industrie est particulièrement bien placée pour fournir des données à grande échelle et des problèmes intéressants qu'il est difficile de recréer en laboratoire.

L'exploitation de cet état d'esprit de l'IA peut contribuer à stimuler l'innovation et, en fin de compte, à améliorer l'interface homme-machine.

Pour plus d'informations, voir le billet de blog, "IP Expo Europe 2018 recap : L'IA et l'apprentissage automatique à l'honneur".

Directeur scientifique de SnapLogic et professeur d'informatique à l'université de San Francisco

Nous recrutons !

Découvrez votre prochaine grande opportunité de carrière.