Un recul stratégique face aux retours de la communauté
Caira Camera, développée par Camera Intelligence — anciennement connue sous le nom d'Alice Camera — avait fait parler d'elle l'année dernière en annonçant l'intégration de Google Nano Banana directement dans son pipeline d'imagerie. L'objectif affiché : permettre aux utilisateurs de modifier radicalement leurs photos et de transformer la réalité. Face aux vives critiques reçues, la marque a choisi de revoir considérablement ses ambitions en matière d'édition générative.
C'est lors du salon CP+ de Yokohama, au Japon, que Vishal Kumar, PDG de Camera Intelligence, a accordé une interview pour expliquer la démarche. Selon lui, l'entreprise a soigneusement écouté les retours de la communauté avant d'ajuster sa trajectoire.
Une fonctionnalité encore trop floue à l'annonce
« Quand nous avons annoncé la fonctionnalité d'édition générative en octobre, c'était un concept extrêmement brut, précoce et nébuleux. Nous ne nous attendions pas à tout faire parfaitement », reconnaît Kumar. Il précise toutefois que cette vision partait d'un constat sincère : de nombreuses personnes extérieures au monde de la photographie trouvent les outils d'édition comme Lightroom ou Photoshop intimidants et difficiles à maîtriser.
« Nous voyions notre fonctionnalité d'édition générative — utilisant Nano Banana — comme un moyen de reproduire des techniques complexes de post-production, en temps réel, via de simples invites en langage naturel. Des techniques jusqu'ici réservées aux workflows sur ordinateur, notamment via Adobe », ajoute-t-il.
Des tests révélateurs avec des créateurs de contenu
Peu après cette annonce, Camera Intelligence a fourni des unités de prévisualisation à plusieurs créateurs reconnus pour les tester. Les résultats ont été instructifs, et pas toujours dans le bon sens.
« Même si nous avions mis des garde-fous en place, ce prototype offrait un accès quasiment illimité à Nano Banana. En pratique, cette "fenêtre de saisie libre" s'est révélée trop effrayante : la plupart des gens tapaient la première chose qui leur venait à l'esprit, souvent quelque chose de vague ou d'absurde, plutôt que de formuler une invite réfléchie », explique Kumar. L'entreprise a également organisé des ateliers avec un groupe restreint de créateurs dans ses bureaux londoniens pour affiner sa compréhension du problème.
Place aux boutons : une expérience plus cadrée
Sur la base de tous ces retours, Camera Intelligence a décidé de reprendre sa copie et d'opter pour une approche beaucoup plus structurée de l'édition générative.
« Nous avons supprimé la fenêtre de saisie libre pour l'instant, et nous avons créé 12 boutons et modèles très spécifiques », détaille Kumar. Parmi les exemples concrets :
- Un bouton pour supprimer les éléments indésirables d'une photo — comparable au remplissage génératif d'Adobe.
- Des transformations d'époque permettant de donner à une image l'apparence des années 2000, 1980, 1960 ou 1920 — une idée similaire à certains appareils instantanés, mais réalisée ici par logiciel.
- Chaque mois, un nouveau bouton sera ajouté en fonction des suggestions crowdsourcées de la communauté.
'Nous croyons que le monde réel est beau et mérite d'être préservé'
Kumar tient à clarifier la philosophie de l'entreprise : l'intégration de l'IA générative dans Caira n'a jamais eu pour vocation de produire des images fictives remettant en question la réalité.
« Nous sommes sincèrement opposés à l'IA de mauvaise qualité. Nous croyons que le monde réel est beau et intéressant, et que les vrais souvenirs méritent d'être préservés. »
« Cela dit, nous sommes prêts à prendre des risques et à explorer les possibilités de cette technologie », poursuit-il. « Nous apprenons, nous itérons, et nous nous engageons à travailler avec nos clients et notre communauté pour faire avancer cette technologie de manière positive. »
Les vraies avancées techniques de Caira Camera
Si l'IA générative capte l'attention, l'équipe de Camera Intelligence travaille en parallèle sur des fonctionnalités de photographie computationnelle bien plus concrètes. C'est Liam Donovan, directeur technique de la société, qui en détaille les contours — et aucune d'entre elles ne repose sur de l'IA générative.
Compatibilité HDR et mode basse lumière avancé
Les fichiers JPEG produits par Caira Camera intègrent une carte de gain cachée, ce qui les rend compatibles avec les écrans HDR — une fonctionnalité encore rare dans les appareils photo traditionnels. Par ailleurs, un nouveau mode basse lumière combine des piles de photos prises rapidement à main levée avec des expositions variables, puis les fusionne en une seule image. Résultat : une réduction significative du bruit et des performances en faible éclairage rivalisant avec celles de capteurs bien plus grands.
La puissance du Qualcomm Snapdragon au cœur du système
« Lorsqu'on utilise l'empilement d'images sur notre appareil, le viseur ne se fige pas — on peut enchaîner les photos empilées les unes après les autres sans interruption. C'est possible grâce à notre puissant processeur Qualcomm Snapdragon, bien plus performant que tout ce qu'on trouve sur un appareil sans miroir traditionnel », souligne Donovan.
L'empilement de photos n'est pas une nouveauté en soi — les smartphones le pratiquent depuis des années. Ce qui distingue Caira, c'est l'association de cette technique avec un grand capteur derrière un objectif interchangeable. Camera Intelligence représente ainsi l'exemple concret de ce qui est possible quand la technologie Qualcomm rencontre un capteur d'appareil photo dédié.
Super-résolution et traitement neuronal en temps réel
L'entreprise envisage également d'intégrer une fonctionnalité de super-résolution à main levée, qui ferait passer la résolution de l'appareil de 11 mégapixels à 44 mégapixels. Cette option est actuellement en phase de test interne.
« De nombreuses fonctions de l'appareil — comme la balance des blancs, l'autofocus et le mappage tonal — sont pilotées par de petits réseaux de neurones sophistiqués fonctionnant en temps réel », précise Kumar. « Notre autofocus utilise par exemple un réseau neuronal pour déterminer comment déplacer l'objectif afin de faire la mise au point, plutôt que de recourir aux techniques classiques de détection de contraste ou de phase. »
Il insiste sur un point essentiel : ces réseaux sont architecturalement distincts des grands modèles de langage modernes, et ne possèdent aucune capacité générative ou hallucinatoire. « Tout le traitement effectué sur l'appareil est strictement prévisible, reproductible et exempt d'IA générative. Toutes les fonctionnalités génératives sont entièrement optionnelles et existent exclusivement en post-traitement. »













