Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Rejoignez nos newsletters quotidiennes et hebdomadaires pour les dernières mises à jour et le contenu exclusif sur la couverture de l’IA. Apprendre encore plus
Google a tranquillement sorti un Application Android expérimentale Cela permet aux utilisateurs d’exécuter des modèles d’intelligence artificielle sophistiqués directement sur leurs smartphones sans nécessiter de connexion Internet, marquant une étape significative dans la poussée de l’entreprise vers l’informatique des bords et le déploiement d’IA axé sur la confidentialité.
L’application, appelée Galerie AI Edgepermet aux utilisateurs de télécharger et d’exécuter des modèles d’IA à partir de la plate-forme de visage étreinte populaire entièrement sur leurs appareils, permettant des tâches telles que l’analyse d’image, la génération de texte, l’assistance à la codage et les conversations multi-virages tout en conservant tous les traitements de données locaux.
La demande, publiée sous une open source Licence Apache 2.0 Et disponible via GitHub plutôt que dans les magasins d’applications officielles, représente les derniers efforts de Google pour démocratiser l’accès aux capacités avancées de l’IA tout en répondant aux problèmes de confidentialité croissants concernant les services d’intelligence artificielle basés sur le cloud.
“La galerie Google AI Edge est une application expérimentale qui met la puissance des modèles d’IA génératifs de pointe directement entre vos mains, exécutant entièrement vos appareils Android”, explique Google dans l’application guide de l’utilisateur. «Plongez dans un monde de cas d’utilisation créative et pratique de l’IA, tous en cours d’exécution localement, sans avoir besoin d’une connexion Internet une fois le modèle chargé.»
L’application s’appuie sur La plate-forme Linet de Googleanciennement connu sous le nom TensorFlow Liteet Frameworks Medipipequi sont spécifiquement optimisés pour exécuter des modèles d’IA sur des appareils mobiles liés aux ressources. Le système prend en charge les modèles de plusieurs cadres d’apprentissage automatique, y compris Jax, Dur, Pytegrochet Tensorflow.
Au cœur de l’offre est celle de Google Modèle Gemma 3un modèle de langage compact de 529 mégaoctets qui peut traiter jusqu’à 2 585 jetons par seconde lors de l’inférence du préfilé sur les GPU mobiles. Cette performance permet des temps de réponse sous-seconde pour des tâches telles que la génération de texte et l’analyse d’image, ce qui rend l’expérience comparable aux alternatives basées sur le cloud.
L’application comprend trois capacités de base: le chat AI pour les conversations multi-tours, demandez à l’image des questions de questions visuelles et invite Lab pour les tâches de tour de retour en un seul tel que la résumé de texte, la génération de code et la réécriture de contenu. Les utilisateurs peuvent basculer entre les différents modèles pour comparer les performances et les capacités, avec des repères en temps réel montrant des métriques comme le temps pour d’abord et la vitesse de décodage.
“La quantification INT4 coupe la taille du modèle jusqu’à 4x sur BF16, réduisant l’utilisation et la latence de la mémoire”, a noté Google dans documentation techniquese référant aux techniques d’optimisation qui rendent les modèles plus importants faisant réaliser sur le matériel mobile.
L’approche de traitement local répond aux préoccupations croissantes concernant la confidentialité des données dans les applications d’IA, en particulier dans les industries, gérant les informations sensibles. En gardant des données sur les appareils, les organisations peuvent maintenir le respect des réglementations de confidentialité tout en tirant parti des capacités d’IA.
Ce changement représente une réimagination fondamentale de l’équation de confidentialité de l’IA. Plutôt que de traiter la vie privée comme une contrainte qui limite les capacités de l’IA, le traitement sur les appareils transforme la vie privée en un avantage concurrentiel. Les organisations n’ont plus besoin de choisir entre une IA puissante et une protection des données – elles peuvent avoir les deux. L’élimination des dépendances du réseau signifie également que la connectivité intermittente, traditionnellement une limitation majeure pour les applications d’IA, devient sans importance pour les fonctionnalités de base.
L’approche est particulièrement précieuse pour les secteurs comme les soins de santé et la finance, où les exigences de sensibilité des données limitent souvent l’adoption de l’IA des nuages. Les applications sur le terrain telles que les diagnostics d’équipement et les scénarios de travail à distance bénéficient également des capacités hors ligne.
Cependant, le passage au traitement sur les appareils introduit de nouvelles considérations de sécurité auxquelles les organisations doivent aborder. Bien que les données elle-même deviennent plus sécurisées en ne quittent jamais l’appareil, la focalisation se déplace vers la protection des appareils eux-mêmes et les modèles d’IA qu’ils contiennent. Cela crée de nouveaux vecteurs d’attaque et nécessite différentes stratégies de sécurité que les déploiements d’IA basés sur le cloud traditionnels. Les organisations doivent désormais considérer la gestion de la flotte d’appareils, la vérification de l’intégrité du modèle et la protection contre les attaques contradictoires qui pourraient compromettre les systèmes d’IA locaux.
La décision de Google intervient dans l’intensification de la concurrence dans l’espace d’IA mobile. Pomme Moteur neuronalintégrés à travers les iPhones, les iPads et les Mac, alimente déjà le traitement du langage en temps réel et la photographie de calcul sur les appareils. Qualcomm’s Vous avez du moteurintégré aux puces Snapdragon, entraîne la reconnaissance vocale et les assistants intelligents dans les smartphones Android, tandis que Samsung utilise Embedded unités de traitement neuronal dans les appareils Galaxy.
Cependant, l’approche de Google diffère considérablement des concurrents en se concentrant sur l’infrastructure de la plate-forme plutôt que sur les fonctionnalités propriétaires. Plutôt que de concurrencer directement sur des capacités d’IA spécifiques, Google se positionne comme la couche de fondation qui permet toutes les applications d’IA mobiles. Cette stratégie fait écho à la plate-forme réussie des joue de l’histoire de la technologie, où le contrôle de l’infrastructure s’avère plus précieux que le contrôle des applications individuelles.
Le moment de cette stratégie de plate-forme est particulièrement astucieux. À mesure que les capacités d’IA mobiles deviennent marchandises, la valeur réelle se déplace vers quiconque peut fournir les outils, les cadres et les mécanismes de distribution dont les développeurs ont besoin. En ouverte la technologie et en la rendant largement disponible, Google assure une large adoption tout en maintenant le contrôle de l’infrastructure sous-jacente qui alimente l’ensemble de l’écosystème.
L’application fait actuellement face à plusieurs limites qui soulignent sa nature expérimentale. Les performances varient considérablement en fonction du matériel de l’appareil, avec des appareils haut de gamme comme le Pixel 8 pro Gérer les modèles plus importants en douceur tandis que les appareils de niveau intermédiaire peuvent éprouver une latence plus élevée.
Les tests ont révélé des problèmes de précision avec certaines tâches. L’application a parfois fourni des réponses incorrectes à des questions spécifiques, telles que l’identification incorrecte du nombre d’équipage pour le vaisseau spatial fictif ou les couvertures de bandes dessinées mal identifiées. Google reconnaît ces limitations, l’IA elle-même indiquant lors des tests qu’il était «toujours en cours de développement et d’apprentissage toujours».
L’installation reste lourde, obligeant les utilisateurs à activer le mode développeur sur les appareils Android et à installer manuellement l’application via Fichiers APK. Les utilisateurs doivent également créer des comptes de visage étreintes pour Télécharger des modèlesajoutant une friction au processus d’intégration.
Les contraintes matérielles mettent en évidence un défi fondamental confronté à l’IA mobile: la tension entre la sophistication du modèle et les limitations de l’appareil. Contrairement aux environnements cloud où les ressources de calcul peuvent être mises à l’échelle presque infiniment, les appareils mobiles doivent équilibrer les performances de l’IA contre la durée de vie de la batterie, la gestion thermique et les contraintes de mémoire. Cela oblige les développeurs à devenir des experts dans l’optimisation de l’efficacité plutôt que de simplement tirer parti de la puissance de calcul brute.
Google Galerie Edge AI marque plus qu’une autre version expérimentale de l’application. La société a tiré le coup d’ouverture dans ce qui pourrait devenir le plus grand changement d’intelligence artificielle depuis que le cloud computing a émergé il y a deux décennies. Alors que les géants de la technologie ont passé des années à construire des centres de données massifs pour alimenter les services d’IA, Google parie désormais que l’avenir appartient aux milliards de smartphones que les gens portent déjà.
Cette décision va au-delà de l’innovation technique. Google veut changer fondamentalement la façon dont les utilisateurs se rapportent à leurs données personnelles. Les violations de confidentialité dominent les titres chaque semaine et les régulateurs du monde entier réduisent les pratiques de collecte de données. La transition de Google vers le traitement local offre aux entreprises et aux consommateurs une alternative claire au modèle commercial basé sur la surveillance qui a propulsé Internet pendant des années.
Google a soigneusement chronométré cette stratégie. Les entreprises luttent avec les règles de gouvernance de l’IA tandis que les consommateurs se méfient de plus en plus sur la confidentialité des données. Google se positionne comme la base d’un système d’IA plus distribué plutôt que de concurrencer la tête-à-tête avec le matériel étroitement intégré d’Apple ou les puces spécialisées de Qualcomm. La société construit la couche d’infrastructure qui pourrait exécuter la prochaine vague d’applications AI sur tous les appareils.
Les problèmes actuels avec l’application – une installation difficile, des réponses erronées occasionnelles et des performances variables entre les appareils – disparaîtront probablement lorsque Google affine la technologie. La plus grande question est de savoir si Google peut gérer cette transition tout en gardant sa position dominante sur le marché de l’IA.
Le Galerie Edge AI révèle que Google reconnaît que le modèle d’IA centralisé qu’il a aidé à construire peut ne pas durer. Google est ouvert ses outils et rend l’IA à disposition largement disponible car il pense que le contrôle de l’infrastructure d’IA de demain compte plus que la possession des centres de données d’aujourd’hui. Si la stratégie fonctionne, chaque smartphone fait partie du réseau d’IA distribué de Google. Cette possibilité rend ce lancement silencieux d’application beaucoup plus important que ne le suggère que son label expérimental.