Meta parie sur la vision et la voix pour populariser son IA
L'assistant d'intelligence artificielle Meta AI peut désormais faire la conversation avec les utilisateurs, sur les applications (Facebook, Instagram, WhatsApp) ou les lunettes connectées du groupe américain, qui rêve de prendre la tête de la course aux compagnons IA.
"Meta AI est en passe de devenir l'assistant IA le plus utilisé au monde d'ici la fin de l'année. En fait, c'est probablement déjà la cas", a déclaré mercredi Mark Zuckerberg, le patron de Meta, lors de l'événement annuel du groupe pour présenter ses nouveautés.
Comme ChatGPT (OpenAI) ou Gemini (Google), Meta AI répond gratuitement aux questions des utilisateurs, crée des images à la demande, rédige des messages, propose des itinéraires touristiques ou des idées d'activités.
Meta a annoncé mercredi que son assistant gagnait en naturel : il va désormais interagir à l'oral et aussi analyser des images. Il peut par exemple proposer une recette à partir de la photo d'un plat ou encore éditer un cliché selon des requêtes.
Les utilisateurs pourront choisir entre différentes voix artificielles ou les voix IA de célébrités, dont l'actrice américaine Awkwafina, la comédienne britannique Judi Dench ou encore la vedette du catch John Cena.
En juin dernier l'ajout de la voix à ChatGPT avait forcé OpenAI à présenter des excuses à l'actrice Scarlett Johansson pour avoir conçu une voix très proche de la sienne, suscitant une polémique sur la création de voix copiées sur celles des humains.
- "Pas très personnel" -
Sur les lunettes connectées Ray-Ban, avec caméra et écouteurs intégrés, les usagers converseront avec l'assistant, au lieu de devoir le relancer par son nom avant chaque question. Il peut aussi traduire en direct les propos d'un interlocuteur.
Mais pour l'instant, Meta AI "n'est pas très personnel. Je n'ai pas l'impression qu'il me connaît bien", juge Carolina Milanesi, analyste indépendante.
Elle a adopté les Ray-Ban comme lunettes de soleil depuis près d'un an, et s'en sert pour prendre des photos, écouter de la musique dans la rue ou encore réaliser des vidéos de présentations de nouveaux produits.
Mais elle pense que "beaucoup de consommateurs vont avoir du mal à faire confiance" à Meta, numéro deux mondial de la publicité en ligne.
Pour en faire un véritable compagnon numérique, le groupe californien va devoir naviguer entre une meilleure personnalisation de l'outil, nécessitant plus d'informations sur les utilisateurs, et le respect de la confidentialité des données.
L'équation est particulièrement difficile à résoudre en Europe, qui a adopté des lois sur les données personnelles, les marchés numériques et l'IA.
Plusieurs grands groupes américains, dont Apple et Meta, ont ainsi suspendu le déploiement de leurs outils d'IA générative (traitement et production de textes, images et autres contenus sur simple requête en langage courant) dans l'Union européenne.
- Métavers -
Mercredi, Meta a indiqué que près de 500 millions de personnes consultaient désormais Meta AI au moins une fois par mois.
Mais la concurrence est féroce. Google et Microsoft (principal investisseur d'OpenAI) ont pris une longueur d'avance, notamment dans la productivité et l'accomplissement d'actions à la demande.
Quant à Apple, enfin de la partie, il vient de lancer ses premiers iPhone avec de l'IA générative intégrée directement dans son système d'exploitation, pour transformer l'assistant vocal Siri en une sorte de secrétaire omniscient, toujours à disposition.
Meta a mis les bouchées doubles avec différentes versions de son modèle de langage Llama, déployé en open source (code de programmation ouvert).
Dans l'édition photo, Meta AI peut ajouter des arrière-plans sur un cliché, ou encore créer des images de l'utilisateur en super héros ou astronaute, à partir d'un scan de son visage.
Le résultat ressemble à celui des outils concurrents : des images haute définition aux couleurs vives avec souvent des détails bizarres, comme le nombre de doigts à chaque main, approximatif.
Meta persévère aussi dans le métavers, sa vision d'un mélange du réel et du virtuel via des lunettes et casques high tech.
L'entreprise a lancé le Quest 3S, son nouveau casque de réalités mixtes (augmentée et virtuelle), un modèle d'entrée de gamme pour séduire plus de consommateurs. Il sera commercialisé à partir de 300 dollars.
Mark Zuckerberg a conclu sa présentation avec Orion, son premier prototype de lunettes à réalité augmentée, qui combinent des projections holographiques de pointe et l'apparence de montures quasiment anodines.
La branche Reality Labs, chargée du développement d'appareils et de logiciels pour le métavers, perd plusieurs milliards de dollars tous les trimestres.
U. Schmidt--BTZ