Qu'est-ce qu'une analyse TruthLens ?

Une analyse correspond au traitement complet d'une image : calcul du hash SHA256, extraction EXIF, Error Level Analysis (ELA), détection IA générative, analyse PRNU, vérification C2PA et génération du rapport de verdict.

Puis-je utiliser TruthLens pour contester une fraude sur une plateforme de vente en ligne ?

Oui. Le rapport PDF certifié généré par TruthLens inclut le hash SHA256 du fichier, l'horodatage de l'analyse, le score de probabilité et les détails forensiques. Ce document peut être soumis au service client de la plateforme de vente ou à un avocat comme élément de preuve.

Les quotas se renouvellent-ils chaque mois ?

Oui, les quotas d'analyses (images ET vidéos, comptés séparément) sont remis à zéro chaque mois à la date de renouvellement de votre abonnement. Les analyses non utilisées ne sont pas reportées. Vous pouvez aussi acheter des analyses à l'unité à tout moment (image 2 €, vidéo 5 €) — ces crédits ne périment pas.

Mes images et vidéos sont-elles conservées après l'analyse ?

Non. Les fichiers uploadés (images comme vidéos) sont supprimés immédiatement après l'analyse. Seuls les métadonnées, le hash SHA256 et les résultats d'analyse sont conservés dans votre historique, conformément à notre politique de confidentialité RGPD.

Comment obtenir des analyses gratuites supplémentaires ?

Si votre quota mensuel est épuisé, vous pouvez regarder une vidéo publicitaire partenaire de 30 secondes pour débloquer 1 analyse image supplémentaire. Limite : 1 visionnage par jour pour les visiteurs anonymes, 10 par jour pour les comptes inscrits.

À quoi sert le rapport certifié opposable ?

Le rapport certifié ajoute un sceau cryptographique HMAC-SHA256, un horodatage ancré sur la blockchain via OpenTimestamps, et une URL de vérification publique. Il est conçu pour être présenté à une rédaction, une assurance ou un juge — n'importe quel destinataire peut valider l'intégrité du document sans compte TruthLens.

Détecter une image Stable Diffusion : guide forensique

Stable Diffusion est devenu, en quelques années, le modèle de génération d'images le plus répandu au monde — précisément parce qu'il est open source, gratuit et déployable sur une simple carte graphique grand public. Cette ouverture est aussi sa particularité forensique : contrairement à des services fermés, il n'impose aucun watermark fiable et laisse une infinité de variantes circuler. Apprendre à détecter une image Stable Diffusion suppose donc de comprendre comment fonctionne la diffusion, quels artefacts elle laisse, et pourquoi le traçage est si difficile.

Ce guide forensique détaille les signaux visuels récurrents, les indices fréquentiels et spectraux, ainsi que la chaîne d'analyse multi-couches qui permet de trancher quand l'œil ne suffit plus.

Pourquoi Stable Diffusion est un cas forensique à part

Stable Diffusion n'est pas un produit unique mais une famille : SD 1.5, SD 2.1, SDXL, SD3, plus des centaines de modèles affinés (checkpoints) et de LoRA partagés par la communauté. Chaque variante a sa propre signature statistique. Un détecteur Stable Diffusion entraîné sur SDXL peut totalement manquer une image produite par un checkpoint anime exotique.

Open source = pas de watermark fiable

Les services fermés (comme certaines API commerciales) peuvent imposer un marquage invisible ou des métadonnées de provenance. Avec Stable Diffusion exécuté localement, l'utilisateur contrôle tout le pipeline : il peut désactiver le watermark optionnel, retirer les métadonnées, recompresser l'image. En pratique, l'absence de marqueur n'est jamais une preuve d'authenticité — seulement une absence d'information.

La diffusion latente, source des artefacts

Stable Diffusion travaille dans un espace latent compressé via un autoencodeur (VAE), puis décode vers les pixels. Cette étape de décodage VAE est la principale source d'artefacts diffusion : reconstructions approximatives des hautes fréquences, textures « savonneuses », et signatures périodiques dans le domaine spectral. C'est précisément là que l'analyse forensique va chercher.

Le processus de génération lui-même mérite d'être compris. Partant d'un bruit gaussien pur, le modèle « débruite » l'image en plusieurs dizaines d'étapes guidées par un texte (prompt) encodé. À chaque pas, le réseau prédit le bruit à retirer. Ce mécanisme itératif explique deux choses : d'une part la cohérence locale remarquable des images SD (les pixels voisins s'accordent), d'autre part leur faiblesse sur la cohérence globale (l'ensemble de la scène n'est jamais raisonné comme un tout physique). Les défauts qui en résultent ne sont donc pas aléatoires : ils suivent la logique du débruitage et du décodage, ce qui les rend, en partie, prévisibles et donc détectables.

Le rôle des échantillonneurs et du nombre de pas

La signature d'une image dépend aussi de paramètres de génération souvent ignorés : l'échantillonneur (sampler), le nombre de pas de débruitage, l'échelle de guidage (CFG scale). Un faible nombre de pas laisse davantage d'artefacts résiduels ; un CFG trop élevé sature les contrastes et crée des aberrations chromatiques caractéristiques. Ces réglages, combinés au checkpoint utilisé, multiplient les variantes statistiques qu'un détecteur doit couvrir.

Les artefacts visuels récurrents de Stable Diffusion

Avant toute analyse technique, un examen attentif révèle déjà beaucoup. Stable Diffusion partage des défauts avec les autres générateurs, mais en présente certains de façon caractéristique.

Anatomie et mains

Les mains restent le talon d'Achille historique. SDXL a fortement progressé, mais les versions plus anciennes ou les checkpoints communautaires produisent encore des doigts en trop, des jointures impossibles, des ongles fondus. Surveillez aussi les dents (nombre variable), les oreilles asymétriques et les yeux dont les reflets (catchlights) ne correspondent pas entre l'œil gauche et l'œil droit.

Textures et arrière-plans

La signature la plus typique de Stable Diffusion est la texture organique légèrement « ondulante » sur les surfaces uniformes : peau, ciel, murs. À l'arrière-plan, les éléments répétitifs (foules, fenêtres, feuillages) se dégradent en bouillie cohérente de loin mais incohérente de près. Le texte affiché — enseignes, livres, panneaux — est souvent du pseudo-alphabet.

Reflets, ombres et cohérence physique

Les diffusions peinent à respecter une source de lumière unique. Cherchez des ombres portées dans des directions divergentes, des reflets dans les miroirs ou les lunettes qui ne correspondent pas à la scène, des bijoux dont la structure se brise. Ces incohérences physiques sont détaillées dans notre catalogue des artefacts typiques des images IA.

La signature « esthétique » des checkpoints

Au-delà des défauts, Stable Diffusion impose souvent un « look » reconnaissable selon le checkpoint : contraste poussé, saturation élevée, vignettage artificiel, netteté uniforme sur tout le cadre (alors qu'un objectif réel produit une profondeur de champ progressive). Les checkpoints photoréalistes populaires partagent une douceur de peau et un rendu de lumière « studio » qui, à force, deviennent un indice en soi pour un œil entraîné. Cette uniformité esthétique contraste avec la diversité imparfaite des vraies photographies.

Signaux fréquentiels et spectraux

Quand l'inspection visuelle ne tranche pas, le domaine fréquentiel devient l'arme principale contre Stable Diffusion.

La signature du décodeur VAE

Le décodage VAE introduit des motifs périodiques réguliers, invisibles à l'œil mais visibles dans le spectre de Fourier 2D. Une photographie authentique présente un spectre relativement lisse et décroissant ; une image diffusion montre souvent des pics ou des grilles régulières correspondant aux convolutions transposées du décodeur. C'est l'un des signaux les plus robustes, car difficile à effacer sans dégrader l'image.

Analyse du bruit haute fréquence

Les capteurs photo réels laissent un bruit caractéristique (PRNU, bruit de grain). Les images Stable Diffusion ont un profil de bruit synthétique : trop homogène, ou au contraire structuré de manière non naturelle. L'analyse du résidu haute fréquence sépare souvent net une photo d'une génération.

Concrètement, une photographie issue d'un capteur CMOS porte une empreinte de bruit non uniforme, propre à chaque capteur (le PRNU, ou Photo-Response Non-Uniformity), qui se comporte comme une « empreinte digitale » physique. Une image de diffusion ne possède aucun PRNU cohérent, puisqu'aucun capteur n'a jamais existé. Quand un fraudeur ajoute du grain artificiel pour imiter une photo, ce grain est statistiquement trop régulier ou mal corrélé aux canaux de couleur, ce qu'une analyse de bruit détecte.

Corrélations inter-canaux et démosaïquage

Une vraie photo numérique passe par un dématriçage (demosaicing) qui laisse des corrélations subtiles entre canaux rouge, vert et bleu, liées à la matrice de Bayer du capteur. Les images Stable Diffusion ne reproduisent pas fidèlement ces corrélations, faute de pipeline de capture réel. L'examen de ces relations inter-canaux constitue un signal forensique difficile à effacer sans dégrader visiblement l'image, et complète utilement l'analyse spectrale.

Tableau récapitulatif des signaux

Signal	Type	Robustesse	Résiste à recompression JPEG ?
Mains / anatomie	Visuel	Faible (corrigé sur SDXL+)	Oui
Pseudo-texte	Visuel	Moyenne	Oui
Texture ondulante	Visuel	Moyenne	Partiellement
Pics spectraux VAE	Fréquentiel	Élevée	Partiellement
Profil de bruit	Fréquentiel	Élevée	Faiblement
Incohérence ombres/reflets	Sémantique	Élevée	Oui
Métadonnées EXIF	Conteneur	Très faible	Non (souvent absentes)

Pourquoi le traçage de Stable Diffusion est si difficile

Identifier qu'une image est générée par IA est une chose ; prouver qu'elle vient de Stable Diffusion plutôt que d'un autre modèle en est une autre.

Une infinité de variantes

Avec des milliers de checkpoints affinés et de LoRA, la « signature » d'une image SD varie énormément. Un modèle photoréaliste affiné élimine la plupart des artefacts grossiers. C'est pourquoi distinguer Stable Diffusion de Midjourney ou de DALL·E demande une combinaison de signaux, jamais un seul critère.

Post-traitement et blanchiment

Les fraudeurs recompressent, recadrent, ajoutent du grain, passent l'image dans un upscaler ou un filtre Instagram. Chaque étape efface partiellement les signatures. Un upscaler peut même réintroduire un profil de bruit trompeur. La robustesse d'un détecteur se mesure à sa résistance à ces transformations.

La course technologique permanente

Chaque nouvelle version de Stable Diffusion réduit les artefacts détectables. Les méthodes purement visuelles se périment vite ; seules les approches multi-signaux, mises à jour en continu, restent fiables dans la durée.

Le rôle des outils ControlNet et inpainting

Stable Diffusion ne se limite pas à la génération « texte vers image ». Des extensions comme ControlNet, l'img2img ou l'inpainting permettent de partir d'une vraie photo et de n'en modifier qu'une partie. Le résultat est un hybride : zones authentiques (avec vrai bruit de capteur) et zones synthétiques cohabitent dans le même fichier. Ces montages sont les plus pernicieux, car les signaux globaux se brouillent. C'est précisément là que l'analyse locale, pixel par pixel, devient indispensable : il faut localiser la zone trafiquée plutôt que de juger l'image en bloc.

La méthode multi-couches de TruthLens

Aucun indicateur isolé ne suffit face à Stable Diffusion. TruthLens combine plusieurs couches d'analyse indépendantes et pondère leurs verdicts, ce qui réduit les faux positifs et résiste mieux au blanchiment.

Les couches d'analyse

EXIF & conteneur : présence/absence de métadonnées caméra, signatures de logiciels d'édition.
C2PA : vérification des manifestes de provenance lorsque présents.
ELA pixel-level : l'Error Level Analysis révèle les zones recompressées ou composites.
Vision IA : modèles entraînés à reconnaître les signatures de diffusion, y compris spectrales.
Watermark / PRNU : recherche de marqueurs de provenance et analyse du bruit capteur.

Du verdict au rapport certifié

TruthLens agrège ces couches en un score de confiance lisible, puis génère un rapport PDF certifié (empreinte SHA-256 + horodatage) recevable dans un contexte professionnel ou juridique. Pour tester une image suspecte, il suffit de la déposer sur la page d'analyse forensique d'images.

Quand l'automatisation a ses limites

Sur les checkpoints photoréalistes très soignés, même un système multi-couches renvoie parfois un score intermédiaire. Le bon réflexe est alors de recouper avec le contexte : provenance, recherche d'image inversée, cohérence narrative. L'outil oriente le jugement, il ne le remplace pas.

Pourquoi pondérer vaut mieux que trancher

Un classificateur unique répond par oui ou non, ce qui le rend fragile : un seul faux signal le fait basculer. En pondérant plusieurs couches indépendantes, TruthLens raisonne en faisceau d'indices. Si l'analyse spectrale, le profil de bruit et l'absence d'EXIF convergent, la confiance monte ; si une seule couche s'écarte, le système le signale plutôt que de masquer l'incertitude. Cette transparence est essentielle dans un contexte où le verdict peut avoir des conséquences réelles — éditoriales, contractuelles ou juridiques.

Checklist pratique pour détecter une image Stable Diffusion

Zoomez sur les détails fins : mains, dents, yeux, bijoux, texte affiché.
Inspectez les surfaces uniformes : peau, ciel, murs (texture ondulante ?).
Vérifiez la physique : ombres, reflets, sources de lumière cohérentes ?
Examinez les métadonnées EXIF : absence totale = signal faible mais notable.
Lancez une analyse multi-couches quand le doute persiste.
Recoupez la provenance par recherche inversée.

Cette démarche reste valable pour l'ensemble des générateurs : nos principes généraux sont détaillés dans le guide comment détecter une image générée par IA.

Cas d'usage concrets

Au-delà de la curiosité, savoir détecter une image Stable Diffusion répond à des besoins professionnels précis.

Journalisme et fact-checking

Les rédactions reçoivent des images de sources anonymes lors d'événements chauds. Une génération SD bien réalisée, présentée comme une photo de terrain, peut polluer un sujet sensible. La rapidité prime : un verdict en quelques secondes, doublé d'un rapport horodaté, sécurise la décision de publication et protège la responsabilité éditoriale.

Assurance et expertise

Les déclarations de sinistre s'appuient sur des photos de dommages. L'inpainting permet d'ajouter une fissure ou d'aggraver un dégât sur une vraie photo. Détecter la zone synthétique évite des indemnisations frauduleuses. Ici, la traçabilité du rapport (empreinte SHA-256 + horodatage) compte autant que le verdict lui-même.

Recrutement et plateformes

Photos de profil générées, faux justificatifs visuels : les plateformes et services RH ont intérêt à filtrer les contenus synthétiques en amont. Une vérification en volume, automatisée, devient alors un enjeu de confiance pour tout l'écosystème.

FAQ

Stable Diffusion ajoute-t-il un watermark dans ses images ?

Une option de watermark invisible existe dans certaines distributions, mais elle est facilement désactivable et absente de la plupart des déploiements locaux. En pratique, ne comptez jamais sur un watermark pour identifier une image Stable Diffusion : son absence ne prouve rien, sa présence est rare.

Peut-on distinguer Stable Diffusion de Midjourney ou DALL·E ?

Pas avec certitude sur la seule base visuelle, car les checkpoints affinés brouillent les frontières. L'attribution à un modèle précis repose sur une combinaison de signaux spectraux, de profils de bruit et de signatures de décodeur, et reste probabiliste plus que catégorique.

Une image upscalée ou recompressée reste-t-elle détectable ?

Souvent oui, mais avec une confiance réduite. L'upscaling et la recompression JPEG effacent une partie des signatures spectrales. Les signaux sémantiques (incohérences d'ombres, anatomie) et l'analyse de bruit restent alors les plus fiables, d'où l'intérêt d'une approche multi-couches.

Les détecteurs Stable Diffusion gratuits sont-ils fiables ?

Ils donnent une première indication mais sont vite périmés face aux nouveaux modèles et peu robustes au post-traitement. Pour un verdict argumenté et un rapport opposable, un outil forensique multi-couches comme TruthLens offre une fiabilité nettement supérieure. Découvrez aussi nos méthodes de vérification gratuites pour un premier tri.