Contenu commandité

Quand Montréal aide les machines à apprendre

Photo: Amélie Philibert/Benoît Gougeon
Publié le :
Présenté par
Université de Montréal

Quand Montréal aide les machines à apprendre

Comment tirer profit du big data, ces mégadonnées que nous générons à la tonne avec nos gadgets électroniques? Montréal est à l’avant-garde de la recherche dans ce domaine, qui permet des avancées spectaculaires dans plusieurs sphères du quotidien.

En arrivant au troisième étage du pavillon André-Aisenstadt de l’Université de Montréal (UdeM), on s’attend à être accueilli par des consoles géantes où défilent, à grande vitesse, d’obscures séries de chiffres toutes plus incompréhensibles les unes que les autres. Après tout, c’est ici que se trouve l’Institut des algorithmes d’apprentissage de Montréal (MILA), l’un des leaders mondiaux du deep learning (apprentissage profond), soit la conception de formules mathématiques qui permettent de donner un sens aux données produites en quantité colossale par nos ordinateurs, cellulaires et autres GPS.

Or, la réalité est tout autre. «Les gens se font tellement d’idées fausses, tout droit sorties d’un film de science-fiction. Ce n’est pas comme ça qu’on fait la science», explique en souriant Yoshua Bengio, directeur de l’Institut et professeur au Département d’informatique et de recherche opérationnelle, depuis son modeste bureau, caché dans un corridor tout ce qu’il y a de plus banal. Tout près de là, dans ce qui ressemble à n’importe quel local informatique universitaire, des étudiants travaillent en groupe de deux ou trois, postés devant des écrans. Une odeur de poulet réchauffé au micro-ondes flotte dans l’air.

Chaque année, ils sont une vingtaine à rallier les rangs de l’équipe en place, constituée de sept professeurs et de quelque 90 chercheurs, dans le cadre d’une maitrise ou d’un doctorat dans l’une ou l’autre des disciplines liées à l’intelligence artificielle. Ils viennent de partout—France, États-Unis, Pays-Bas, Inde, Corée du Sud, Chine, Grande-Bretagne, Pologne, Russie—, attirés par les excellentes perspectives d’emploi dans ce domaine. Les mégadonnées (parfois aussi appelées données massives) représentent en effet une mine d’informations au potentiel infini, et les employeurs sont prêts à payer rubis sur l’ongle les jeunes finissants de l’UdeM. «On parle de salaires de plusieurs centaines de milliers de dollars, beaucoup plus que ce que je gagne moi-même», s’amuse le professeur de 52 ans, ajoutant du même coup que certains se font recruter un an avant d’avoir obtenu leur diplôme.


La renaissance de l’intelligence artificielle

Il est vrai que l’apprentissage profond—branche fondamentale de la recherche en intelligence artificielle—a le vent en poupe depuis une dizaine d’années. Mais ce ne fut pas toujours le cas. Yoshua Bengio rappelait ainsi, dans un article paru en juin 2016 dans le magazine Scientific American, que «jusqu’au milieu des années 2000, le rêve de construire des machines ayant un degré d’intelligence semblable à celui de l’humain était presque mort au sein de la communauté scientifique. La notion même «d’intelligence artificielle» pouvant atteindre celle d’un humain semblait avoir disparu de la science avancée. Mais après des décennies de déceptions, elle est de retour, remplie de ses promesses initiales, grâce à une technique superpuissante: l’apprentissage profond», écrit-il dans «Machines Who Learn» («ces machines qui apprennent»).

On produit en deux jours plus de données que ce qu’on a généré depuis le début de l’humanité.

Le chercheur n’a pas attendu l’engouement contemporain pour se dévouer à ces algorithmes complexes. Il est d’ailleurs considéré comme un pionnier dans cette discipline qui consiste, pour faire simple, à s’inspirer du fonctionnement du cerveau humain pour apprendre aux ordinateurs à exécuter d’eux-mêmes diverses tâches grâce à de grandes quantités de données. Celles-ci servent d’exemples à l’ordinateur, lui montrant comment fonctionne le monde autour de nous—ou du moins les aspects de ce monde illustrés par ces données.

D’aussi loin qu’il se souvienne, Yoshua Bengio s’est toujours intéressé à l’informatique et à ses ramifications complexes. Arrivé de Paris à 12 ans avec ses parents marocains, l’adolescent et son frère (aujourd’hui chercheur chez Google, en Californie) ont rapidement amassé leurs économies dans le but de se procurer leurs tout premiers ordinateurs—«un Apple IIe, suivi d’un Atari 800», se rappelle-t-il.

Quelques années plus tard, alors qu’il étudiait l’informatique à l’Université McGill, Yoshua Bengio est tombé sur une série d’articles à propos des réseaux de neurones artificiels, la base de ce qui allait devenir plus tard l’apprentissage profond. Coup de foudre instantané, qui l’a incité à entamer une maitrise dans ce domaine, puis un doctorat à l’Université McGill, et enfin un postdoctorat au Massachusetts Institute of Technology.

À l’heure actuelle, les algorithmes générés par l’apprentissage profond servent à mettre au point des systèmes de conduite pour les voitures autonomes (surtout pour capter le contenu visuel devant la voiture) et des outils permettant de reconnaitre des personnes sur des photos diffusées sur l’internet, de traduire des échanges d’une langue à une autre ou encore de donner des directives à son téléphone intelligent. Aux États-Unis, jusqu’à quatre adolescents sur dix communiquent de cette manière avec le leur. Celui du professeur Bengio lui répond parfois, ce qui ne l'empêche pas de préférer le carnet pour coucher les idées qui surgissent la nuit. Mais aussi impressionnantes que soient ces découvertes, elles ne constituent que les premiers balbutiements de cette science abyssale.


Un océan de données

C’est que les mégadonnées qui alimentent ces machines forment un flux particulièrement ardu à traiter. Depuis 2003, époque surconnectée oblige (Facebook, Snapchat, applications de rencontres, jeux vidéos, etc.), on produit en deux jours plus de données que ce qu’on a généré depuis le début de l’humanité.

«Les données ont toujours existé; les sciences qui les étudient aussi. La différence, c’est qu’on est passé d’un étang à un océan, et que les machines peuvent maintenant apprendre à partir des données », image Valérie Bécaert, qui, deux étages au-dessus du bureau de Yoshua, agit comme directrice générale de l’IVADO, lequel regroupe plus de 150 chercheurs issus de l’UdeM, de HEC Montréal et de Polytechnique Montréal. 

Pour celle qui se définit comme une geek de culture—«Je ne suis pas bonne avec les ordinateurs, mais ils me fascinent!»—, pas de doute: le big data est le reflet de notre société moderne. «Prenez la série House of Cards et le personnage de Frank Underwood… De nos jours, le pouvoir est entre les mains de ceux qui ont accès aux données», croit l’ingénieure de formation.

Un exemple? En vous proposant d’«essayer» des vêtements au moyen d’une cabine virtuelle, une boutique obtient votre numéro de téléphone et l’historique de vos recherches. Deux jours plus tard, votre iPhone vibre au moment où vous passez devant le commerce… qui vous fait part d’une réduction de 10% sur ce pantalon bleu que vous avez classé dans vos favoris. «Vous êtes le produit», souligne Valérie Bécaert dans «Les mégas impacts des mégadonnées», une instructive conférence ted qu’on peut trouver sur YouTube. 

De nos jours, le pouvoir est entre les mains de ceux qui ont accès aux données.


 Quel avenir pour le big data?

Lorsqu’on lui demande quels sont ses rêves les plus fous (mais réalistes) quant aux mégadonnées, les yeux de Valérie Bécaert s’illuminent. «Je pense à des parcs de véhicules autonomes, qui pourront réduire notre consommation d’essence et l’usure des routes. Ou à un assistant virtuel qui sera en mesure de nous aider à faire notre plan de la semaine—tâches ménagères, repas, chauffage—pour réduire au maximum notre empreinte écologique.» 

La médecine, quant à elle, et plus particulièrement l’imagerie médicale, connaissent déjà des avancées intéressantes grâce aux données massives. «Le but ultime est d’en arriver à pouvoir suivre le patient du début à la fin de sa vie, et à lui offrir les meilleurs traitements. De basculer d’une médecine de traitement à une médecine préventive qui tient compte des spécificités de chaque patient», explique-t-elle.

Mais une chose est sure: en médecine comme dans d’autres domaines (assurance, publicité, etc.) où les mégadonnées sont appelées à changer la donne, la vigilance reste de mise. «Ça prend un encadrement. L’idée est d’avoir un intermédiaire entre ceux qui disposent des données—les hôpitaux, par exemple—et ceux qui les produisent—les patients. Il faut s’assurer que ces données soient utilisées pour le bien collectif, et non pas juste au profit de l’entreprise qui les détient», estime Yoshua Bengio. 

Sa collègue Valérie Bécaert approuve, insistant sur l’importance de l’éducation. «Le potentiel d’exploitation de ces mégatonnes de données est phénoménal. Ça peut rendre notre monde meilleur comme ça peut nous rendre idiots, dépendants et vulnérables. Au sein de cet océan de données, il est primordial de mettre à profit notre sens critique pour faire mieux que les machines, qui sont là pour nous aider à prendre des décisions—et non pas pour les prendre à notre place.»


L’Institut de valorisation des données (IVADO)

Fédérant des chercheurs de l’Université de Montréal, HEC Montréal et Polytechnique Montréal, l’IVADO a pour mission de développer une expertise de pointe dans les domaines de la science des données, de l’optimisation (recherche opérationnelle) et de l’intelligence artificielle. Il rassemble plusieurs groupes de recherche, parmi lesquels l’Institut des algorithmes d’apprentissage de Montréal (MILA), plus gros centre de recherche universitaire au monde dédié à l’étude et à la mise au point d’algorithmes d’apprentissage profond, ainsi que toute une constellation d'entreprises, de partenaires et de startups.

ivado.ca / mila.umontreal.ca


Big Data, big statistiques

500 millions de Tweets publiés chaque jour sur Twitter

nouveaux profils créés chaque seconde sur Facebook

4100 statuts rédigés chaque seconde sur Facebook

350 millions de photos ajoutées chaque jour sur Facebook

4,5 milliards de mentions «J’aime» attribuées chaque jour (1,8 million/minute) sur Facebook

10 milliards de messages envoyés chaque jour sur Facebook

70 millions de photos partagées chaque jour sur Instagram


Les enjeux éthiques et sociaux de l’intelligence artificielle

Une conférence sur le sujet, intitulée «La révolution de l’intelligence artificielle» se tiendra le 21 septembre 2016, de 18h à 20h, à l’amphithéâtre Ernest-Cormier (pavillon Roger-Gaudry) de l’Université de Montréal. Invités: Yoshua Bengio, Yann LeCun (Université de New York et Facebook) et Joëlle Pineau (Université McGill). Entrée gratuite. 


Les données, le prochain pétrole

«L’avantage avec le big data, c’est qu’on exploite des données plutôt que des ressources physiques comme l’eau, le bois ou le fer, ce qui nous permet de réduire considérablement notre poids environnemental», croit Valérie Bécaert (IVADO). Un processus qu’on appelle la dématérialisation.

Quelques exemples?

Airbnb. La plus grande plateforme de location d’hébergements au monde n’est propriétaire d’aucun hôtel ni auberge.

Uber. Le plus important service de réservation de voitures avec chauffeur ne possède aucun parc automobile.

Facebook. La plus puissante entreprise médiatique ne produit aucun contenu.

Alibaba. Le plus vaste magasin virtuel ne tient aucune marchandise en stock. 



Montréalaise par ses racines, internationale par vocation, l'Université de Montréal (UdeM) se classe, année après année, dans le premier percentile des meilleures universités de la planète. Elle a été fondée en 1878, et forme aujourd’hui avec ses deux écoles affiliées, HEC Montréal et Polytechnique Montréal, le premier pôle d'enseignement supérieur et de recherche du Québec et l'un des plus importants en Amérique du Nord. L'Université de Montréal réunit plus de 2 600 professeurs et chercheurs et accueille plus de 66 000 étudiants. umontreal.ca


Contenu commandité par l’Université de Montréal, qui détenait le dernier droit de regard sur celui-ci. Ce supplément a été réalisé par Atelier 10 dans le respect de ses lignes directrices balisant la production de contenu de marque.

Continuez sur ce sujet

Atelier 10 dans votre boite courriel
S'abonner à nos infolettres