La plupart des principaux districts miniers à l'échelle mondiale sont dotés de serveurs publics de dépôt de données, sur lesquels d'importants volumes de photographies de carottes de forages indexées par profondeur sont disponibles. Ces photographies représentent une manne de données considérable, actuellement sous-exploitée malgré l'essor récent des algorithmes de traitements d'images.
Une difficulté récurrente de la modélisation de la prospectivité minérale est la capacité à convertir un processus géologique donné, souvent bien compris en termes de relation génétique à la minéralisation, en une variable quantitative cartographiable et utilisable dans un contexte opérationnel d'exploration des gisements. Ce problème est accru souvent par un manque de labels associés aux photographies et facilement utilisables par l'utilisateur dans le cadre d'une approche supervisée (dans laquelle chaque photographie est classée sur la base d'un jeu de données d'entraînement, nécessairement assez vaste pour que l'algorithme soit performant).
On s'attachera ici à une approche différente, dite non supervisée, c'est-à-dire dans laquelle les différentes photographies ne sont pas reclassifiées à partir de labels déjà existants mais où les images se voient attribuer un label automatiquement par différentes méthodes (filtres, données de colorimétrie), chacune ayant pour but d'extraire une information particulière de la donnée image : fronts d'oxydoréduction à partir de la couleur, données structurales à partir de la reconnaissance des linéaments et de leur comptage , caractéristiques texturales (tailles de grains, faciès lithologiques) à partir de descripteurs de texture.. Ces différentes variables extraites sont ensuite replacées en profondeur et utilisées comme données d'entrée d'un modèle géologique de la prospectivité minérale autour du gisement de discordance de Cigar Lake (Saskatchewan, Canada), cas d'étude pris pour cette étude.
Les avantages de l'automatisation de la description des carottes sont multiples, notamment sa fiabilité, sa reproducibilité, sa vitesse d'exécution et la capacité de travailler aisément et rapidement à des résolutions spatiales et des échelles variables.