Trois jeunes gens issus de Stanford ont développé PIGEON, une intelligence artificielle capable de localiser avec précision des photos et d’identifier l’endroit où elles ont été prises, même si elle n’a jamais vu ces photos auparavant. À l’origine, le projet visait à repérer des lieux sur Google Street View, mais il est désormais en mesure de localiser n’importe quelle image Google Street View à travers le monde, avec une grande précision. Ce défi de géolocalisation d’images à l’échelle mondiale est une entreprise difficile, étant donné la diversité des images provenant de tous les coins du globe. Malgré les avancées réalisées par des méthodes basées sur des transformateurs de vision, les spécialistes sont conscients que le succès de la littérature antérieure est limité à des distributions étroites d’images de repère, et que cette performance n’est pas généralisable à des lieux inconnus.
Si la technologie de PIGEON peut s’avérer utile pour identifier des lieux sur des photos anciennes ou pour faciliter des enquêtes biologiques sur la biodiversité, elle soulève également des préoccupations majeures en matière de protection de la vie privée. Des experts s’inquiètent que cette capacité puisse être exploitée à des fins de surveillance gouvernementale, de suivi par des entreprises ou même de harcèlement. En dépit de ses avantages potentiels, l’efficacité de PIGEON pose des questions sur la protection des données personnelles et son utilisation future.
C’est pourquoi les chercheurs de l’Université de Stanford ont introduit un nouveau système de géolocalisation qui intègre la création de cellules géographiques sémantiques, l’apprentissage préalable contrastif multitâche et une nouvelle fonction de perte. Leur travail représente une première tentative d’exploration de groupes de lieux pour affiner les estimations de géolocalisation. Les chercheurs ont démontré que leur modèle PIGEON peut placer plus de 40% de ses estimations à moins de 25 kilomètres de la cible à l’échelle mondiale, en s’appuyant sur des données provenant du jeu Geoguessr. Ils ont même mis au point un bot et ont soumis PIGEON à une expérience en aveugle contre des joueurs humains, se classant parmi les 0,01 % des meilleurs joueurs.
En continuant leurs recherches, les chercheurs sont parvenus à développer un deuxième modèle, PIGEOTTO, qui a dépassé de manière significative les performances de l’ancien modèle de référence en termes de précision des villes et de pays. Ces résultats suggèrent que PIGEOTTO est le premier modèle de géolocalisation d’images capable de généraliser efficacement des lieux inconnus, ouvrant la voie à des systèmes de géolocalisation très précis à l’échelle mondiale.
Malgré ces avancées, la technologie PIGEON soulève des préoccupations légitimes concernant le respect de la vie privée. C’est pourquoi il est essentiel de peser les avantages et les inconvénients de cette technologie et de trouver un équilibre entre son utilité potentielle et les risques qu’elle présente pour la protection des données personnelles.