De la recherche au shopping : 11 nouvelles applications d’intelligence artificielle chez Google
Temps de lecture estimé : 14 minutes
Il n'y a pas que les MUM : lors de la Google I/O 2022, la scène a été dominée par les applications du futur proche rendues possibles par le développement des systèmes d'intelligence artificielle, qui font désormais partie intégrante des travaux de l'entreprise de Mountain View. Les progrès fondamentaux de l'informatique aident à relever certains des plus grands défis du siècle, comme le changement climatique, tandis que l'IA est appliquée dans les mises à jour des produits de l'écosystème Big G, notamment Search, Maps et Photos, ce qui montre comment l'apprentissage automatique peut améliorer la vie des utilisateurs, dans les grandes comme dans les petites choses.
Onze domaines d’utilisation de l’IA dans les produits Google
Il y a notamment 11 nouvelles mises à jour basées sur l'IA annoncées lors de l'événement de la semaine dernière que nous pourrons bientôt voir et utiliser dans notre vie quotidienne. Un aperçu de ces applications innovantes provient d'un billet récapitulatif rédigé par Christine Robson, directrice des produits chez Google Research : du MUM, qui pourrait changer la façon dont le moteur de recherche comprend les requêtes, à Maps et Shopping, en passant par des solutions futuristes qui permettront les premiers diagnostics de santé grâce au smartphone.
LaMDA, une percée dans la compréhension du langage naturel pour le dialogue
Le premier système présenté est LaMDA (abréviation de "Language Model for Dialogue Applications"), défini comme un modèle d'apprentissage automatique conçu pour le dialogue et construit sur Transformer', c'est-à-dire l'architecture de réseau neuronal que Google a inventée et rendue open source, déjà utilisée pour Google BERT.
LaMDA est une fonctionnalité de dialogue et de recherche vocale. Elle peut être entraînée à lire des termes, à comprendre la relation entre les mots d'une phrase et à prédire le mot suivant. Par rapport aux systèmes précédents, il est entraîné à produire des réponses raisonnables et spécifiques et non pas simplement des réponses génériques. Dans la présentation du PDG Pichai, un exemple de son fonctionnement a été montré, qui a démontré une plus grande efficacité que l'actuel Google Assistant, avec des réponses nuancées complexes et, dans certains cas, même humoristiques.
Selon Google, "cette recherche précoce pourrait débloquer des modes d'interaction plus naturels avec la technologie et des catégories entièrement nouvelles d'applications utiles", en s'approchant de la complexité des conversations humaines qui sont "ancrées dans des concepts que nous avons appris tout au long de notre vie, composées de réponses à la fois significatives et spécifiques".
Le MUM va contribuer à rendre Google Search beaucoup plus intelligent
L'article rappelle qu'en 2019 déjà, l'entreprise a lancé BERT, un modèle d'IA Transformer capable de mieux comprendre l'intention derrière les requêtes de recherche, par rapport auquel le modèle unifié multitâche (MUM) est 1000 fois plus puissant.
Pour l'instant, "nous n'en sommes qu'aux premiers stades de l'exploration de MUM" et il n'y a pas encore de date de lancement possible dans le domaine de la recherche - mais, selon les mots de Danny Sullivan, il y aura des annonces et des informations spécifiques le moment venu ; l'objectif est qu'un jour nous puissions "taper une requête longue, dense en informations et à consonance naturelle, et trouver plus rapidement les informations pertinentes" dont nous avons besoin.
Le projet Starline reconnecte les gens
Nous entrons dans le domaine des applications de science-fiction avec le projet Starline, un projet technologique qui combine les progrès du matériel et des logiciels pour permettre aux amis, à la famille et aux collègues de se sentir ensemble, même lorsqu'ils se trouvent dans des villes (ou des pays) différentes.
"Imaginez que vous regardez par une sorte de fenêtre magique ; à travers cette fenêtre, vous voyez une autre personne, grandeur nature et en trois dimensions : vous pouvez parler naturellement, faire des gestes et établir un contact visuel", écrit M. Robson.
Pour créer cette expérience, Google applique des recherches dans les domaines de la vision par ordinateur, de l'apprentissage automatique, de l'audio spatial et de la compression en temps réel ; elle a également mis au point un système d'affichage à champ lumineux qui crée une sensation de volume et de profondeur sans nécessiter de lunettes ou d'écouteurs supplémentaires. L'effet final est le sentiment "que quelqu'un est assis juste en face de vous, comme s'il était là".
Le Campus Quantum AI pour construire (aussi) un super ordinateur
Dans les dix prochaines années, "nous construirons le premier ordinateur quantique au monde avec correction d'erreurs", promet Google, et c'est sur le nouveau campus Quantum AI (intelligence artificielle quantique) que cela sera possible.
Pour relever bon nombre des plus grands défis mondiaux, du changement climatique à la prochaine pandémie, il faudra un nouveau type d'informatique : un ordinateur quantique, à la fois utile et corrigé des erreurs, permettra de refléter la complexité de la nature et de développer de nouveaux matériaux, de meilleures batteries, des médicaments plus efficaces, etc. Pour cela, Google a décidé d'ouvrir un campus Quantum AI à Santa Barbara, en Californie, qui abritera des bureaux de recherche, une usine de fabrication et le premier centre de données quantiques de l'entreprise.
Les cartes permettront de réduire les freinages brusques pendant la conduite
Bientôt, Google Maps utilisera l'apprentissage automatique pour réduire les risques de freinage brusque, c'est-à-dire "les incidents au cours desquels vous freinez brusquement, causés par des situations telles que des embouteillages soudains ou la confusion quant à la sortie d'autoroute à prendre".
Lorsque nous demandons un itinéraire dans Maps, le système calcule l'itinéraire en fonction de nombreux facteurs, tels que le nombre de voies sur une route ou la direction de l'itinéraire. Avec cette mise à jour, il tiendra également compte de la probabilité d'un freinage brusque : Maps identifiera les deux itinéraires les plus rapides à ce moment-là, en recommandant automatiquement celui qui présente le moins de moments de freinage brusque (à condition que l'ETA - heure d'arrivée prévue - soit à peu près la même).
Selon les prévisions de l'entreprise, ces changements pourraient éliminer chaque année plus de 100 millions de freinages brusques sur les trajets effectués avec Google Maps.
Des souvenirs encore plus personnalisés dans Google Photos
Aujourd'hui déjà, grâce à la fonction "Souvenirs", nous pouvons revoir des photos importantes des années passées ou des moments forts de la semaine écoulée. Grâce à l'apprentissage automatique, Google Photos sera bientôt en mesure d'identifier des motifs moins évidents dans les photos : à partir de la fin de l'été, "lorsque nous trouverons un ensemble de trois photos ou plus présentant des similitudes telles que la forme ou la couleur, nous mettrons en évidence ces petits motifs pour vous dans vos souvenirs", annonce la société.
Par exemple, Photos pourrait identifier un modèle de photos de famille prises sur le même canapé au fil des ans - un élément que nous n'avons jamais pensé à rechercher, mais qui raconte une histoire significative de notre vie quotidienne.
Des moments cinématographiques en photos
Google Photos présentera bientôt une autre fonctionnalité, qui n'est pas sans rappeler les images animées que l'on voit dans les films de la saga Harry Potter !
"Lorsque vous essayez d'obtenir la photo parfaite, vous prenez généralement le même cliché deux ou trois (ou 20) fois ; grâce aux réseaux neuronaux, nous pouvons prendre deux images presque identiques et combler les lacunes en créant de nouvelles images intermédiaires", ce qui permet d'obtenir des images vivantes et animées appelées moments cinématiques.
Produire cet effet à partir de rien "prendrait des heures aux animateurs professionnels, mais grâce à l'apprentissage automatique, nous pouvons générer automatiquement ces moments et les intégrer à vos moments forts récents". La fonction ne nécessite pas un téléphone doté de caractéristiques techniques spécifiques et sera disponible pour tous sur Android et iOS.
Google Workspace, de nouvelles fonctionnalités pour une collaboration plus inclusive
Dans Google Workspace - la suite de logiciels et d'outils de productivité pour l'informatique en nuage et la collaboration - l'écriture assistée suggérera un langage plus inclusif le cas échéant. Par exemple, il peut suggérer d'utiliser le mot "chairperson" au lieu de "chairman" ou "mail carrier" au lieu de "mailman". Il peut également offrir d'autres suggestions stylistiques pour éviter la voix passive et le langage offensif, ce qui peut accélérer l'édition et contribuer à améliorer l'écriture.
Applications de l'IA dans Google Shopping
Lors de cet événement, Google a également annoncé un certain nombre de fonctionnalités liées à Google Shopping et au commerce, telles que le lancement du Google Shopping Graph, un nouveau partenariat avec Shopify, des mises à jour de Google Lens, etc.
Le graphique d'achat indique les meilleurs produits pour les besoins particuliers d'un utilisateur, aidant les acheteurs à trouver ce qu'ils recherchent grâce à une connaissance approfondie de tous les produits disponibles, basée sur des informations provenant d'images, de vidéos, d'avis en ligne et même de l'inventaire des magasins locaux.
Le Shopping Graph est un modèle alimenté par l'IA qui suit les produits, les vendeurs, les marques, les avis, les informations sur les produits et les données d'inventaire, ainsi que la manière dont tous ces attributs sont liés les uns aux autres. Alors que les internautes "effectuent des achats sur Google plus d'un milliard de fois par jour, Shopping Graph rend ces sessions plus utiles en les connectant à plus de 24 milliards d'annonces provenant de millions de marchands sur le Web".
Le partenariat avec Shopify est intéressant (bien qu'il ne soit pas lié à l'IA). Il permet aux commerçants qui utilisent la plateforme de simplifier le processus de présentation de leurs produits sur Google en quelques clics, ce qui permet de les faire découvrir aux consommateurs les plus intéressés sur Google Search, Shopping, YouTube, Google Images et d'autres surfaces.
Google a également ajouté la fonctionnalité Google Lens à Google Photos, de sorte qu'il y aura désormais une suggestion dans l'application pour rechercher la photo avec Lens et vous permettre de voir les résultats de recherche qui peuvent vous aider à "trouver cette paire de chaussures ou ce motif de papier peint qui a attiré votre attention".
Google Lens et les avancées de l'AR pour l'apprentissage
Ce n'est pas la seule mise à jour liée à Google Lens, comme l'explique ce billet sur le blog italien de l'entreprise, qui révèle que l'application qui nous permet de rechercher ce que nous voyons (à partir de l'appareil photo, des photos ou même de la barre de recherche) compte " plus de 3 milliards de recherches chaque mois et son utilisation est de plus en plus liée à l'apprentissage ".
C'est précisément pour cette raison que Google a amélioré certains outils, comme le filtre "Taduire dans Lens" qui permet aux utilisateurs de "copier, écouter ou rechercher dans un texte traduit, aidant ainsi les élèves à accéder à du contenu éducatif sur le Web dans plus de 100 langues".
La réalité augmentée (RA) est un autre outil puissant d'apprentissage visuel : une application pratique est "les nouveaux athlètes en réalité augmentée dans Search", qui vous permet de "voir les mouvements distinctifs de certains de vos athlètes préférés en réalité augmentée, comme le célèbre numéro de poutre de Simone Biles".
Un outil pour une assistance dermatologique immédiate
Les deux dernières applications pratiques de l'intelligence artificielle sont assez extraordinaires et concernent toutes deux le domaine de la santé.
Chaque année, "nous voyons des milliards de recherches Google liées à des problèmes de peau, d'ongles et de cheveux, mais il peut être difficile de décrire ce que vous voyez sur votre peau avec des mots seulement", explique Mme Robson. Ce soutien prend la forme d'un "outil d'assistance dermatologique alimenté par l'IA, une application web que nous souhaitons mettre à disposition pour des tests précoces dans l'UE d'ici la fin de l'année", qui facilitera la compréhension des situations cutanées potentielles.
L'utilisation de cet outil est très simple, puisqu'il suffit d'utiliser l'appareil photo du téléphone pour prendre trois images de la peau, des cheveux ou des ongles sous différents angles. Le système posera ensuite des questions sur le type de peau, le moment de l'apparition du problème et l'existence d'autres symptômes, ce qui aidera l'IA à réduire les possibilités.
Le modèle d'IA analyse toutes ces informations et s'appuie sur sa connaissance de 288 conditions médicales pour fournir une liste de problèmes possibles en cours, à approfondir par une recherche ciblée. Bien sûr, Google précise que l'application n'a pas vocation à remplacer le diagnostic médical, mais plutôt à être un bon point de départ.
Un soutien au dépistage de la tuberculose
L'autre domaine très spécifique est celui de l'utilisation médicale de l'IA, qui pourra soutenir la lutte contre la tuberculose, qui reste "l'une des principales causes de décès dans le monde, infecte 10 millions de personnes par an et a un impact disproportionné sur les populations des pays à revenu faible ou intermédiaire".
L'un des problèmes est que "la maladie est très difficile à diagnostiquer à un stade précoce car ses symptômes sont similaires à ceux d'autres maladies respiratoires" ; les radiographies du thorax aident au diagnostic, mais les experts ne sont pas toujours disponibles pour lire les résultats. C'est pourquoi l'Organisation mondiale de la santé (OMS) a récemment recommandé d'utiliser la technologie pour faciliter le dépistage et le triage des cas de tuberculose : les chercheurs de Google étudient "la manière d'utiliser l'intelligence artificielle pour identifier les patients potentiels atteints de tuberculose en vue d'un test de suivi, ce qui permettrait de détecter la maladie à un stade précoce et de l'éradiquer".
Image en vedette de The Keyword, Google