Redimensionner une image

Chaque réseau de neurones attend ses images dans une taille précise : 224x224 pour ResNet, 416x416 pour YOLO, 299x299 pour Inception. Si tu lui donnes une photo de 4000x3000 pixels sortie de ton téléphone, il ne saura pas quoi en faire. Redimensionner, c'est l'opération que tu fais avant quasiment tout traitement en deep learning. C'est aussi ce que fait ton navigateur web des milliers de fois par jour quand il affiche des miniatures.

Imagine que tu as une photo imprimée en grand format et que tu veux la réduire pour la mettre sur une carte postale. Tu ne peux pas garder tous les détails, alors tu échantillonnes : pour chaque position sur la carte postale, tu choisis le point le plus proche sur la grande photo. C'est l'interpolation par plus proche voisin (nearest neighbor).

En pratique, tu utiliserais cv2.resize(image, (largeur, hauteur)) qui propose plusieurs méthodes d'interpolation (bilinéaire, bicubique, etc.). Ici on implémente la version la plus simple avec NumPy pour comprendre le mécanisme fondamental.

Le principe : pour chaque pixel de la nouvelle image, on calcule quel pixel de l'image originale lui correspond, et on prend sa valeur. Pour le pixel (i, j) de la nouvelle image :

orig_i = int(i * hauteur_orig / nouvelle_hauteur)
orig_j = int(j * largeur_orig / nouvelle_largeur)

Avec NumPy, on peut faire ça sans boucle en utilisant des arrays d'indices.

Écris une fonction redimensionner(image, nouvelle_hauteur, nouvelle_largeur) qui renvoie l'image redimensionnée en utilisant l'interpolation par plus proche voisin.

Exemple :
img = np.zeros((10, 10, 3), dtype=np.uint8)
img[0:5, 0:5] = [255, 0, 0] # quart supérieur gauche en bleu
small = redimensionner(img, 5, 5)
small.shape vaut (5, 5, 3)
Le quart supérieur gauche de small est toujours bleu

Ce que tu devrais voir sur ta machine : l'image redimensionnée conserve les mêmes motifs mais en plus petit ou plus grand. Pour comparer, affiche l'originale et la redimensionnée côte à côte.

Tests (5/5)

Forme correcte

import numpy as np
img = np.zeros((10, 20, 3), dtype=np.uint8)
result = redimensionner(img, 5, 10)
assert result.shape == (5, 10, 3), f'Forme attendue (5, 10, 3), obtenue {result.shape}'

Reduire de moitie

import numpy as np
img = np.zeros((10, 10, 3), dtype=np.uint8)
img[0:5, 0:5] = [255, 0, 0]
result = redimensionner(img, 5, 5)
assert list(result[0, 0]) == [255, 0, 0], 'Le coin superieur gauche doit rester bleu'
assert list(result[4, 4]) == [0, 0, 0], 'Le coin inferieur droit doit rester noir'

Agrandir

import numpy as np
img = np.array([[[255, 0, 0], [0, 255, 0]], [[0, 0, 255], [128, 128, 128]]], dtype=np.uint8)
result = redimensionner(img, 4, 4)
assert result.shape == (4, 4, 3)
assert list(result[0, 0]) == [255, 0, 0]

Image uniforme reste uniforme

import numpy as np
img = np.full((8, 8, 3), 100, dtype=np.uint8)
result = redimensionner(img, 4, 4)
assert np.all(result == 100), 'Une image uniforme redimensionnee doit rester uniforme'

Dtype conserve

import numpy as np
img = np.zeros((6, 6, 3), dtype=np.uint8)
result = redimensionner(img, 3, 3)
assert result.dtype == np.uint8, 'Le dtype doit rester uint8'

Indices (3 disponibles)

Solution officielle

import numpy as np

def redimensionner(image, nouvelle_hauteur, nouvelle_largeur):
    h_orig, w_orig = image.shape[:2]
    lignes = (np.arange(nouvelle_hauteur) * h_orig / nouvelle_hauteur).astype(int)
    colonnes = (np.arange(nouvelle_largeur) * w_orig / nouvelle_largeur).astype(int)
    return image[np.ix_(lignes, colonnes)]

← Extraire une region d'interet (ROI) Retourner et pivoter une image →

solution.py

Bravo!

Redimensionner une image

Tests (5/5)

Indices (3 disponibles)

Solution officielle