Cours:Classif : Différence entre versions

Version actuelle datée du 21 janvier 2026 à 12:28

TP Classification : détection d'objet en temps réel par vision

Le travail de cette étape va consister à

analyser des images acquises en "temps réel" afin de détecter et identifier des objets
les objets seront
- dans un premier temps des jetons de nain jaune
- dans un second temps des briques lego.

Sommaire

1 Technos matérielles et logicielles
2 Connexion à la Rpi et test d'acquisition en ligne de commande
3 Capture d'image et affichage en temps réel
4 Prétraitement
5 Reconnaissance simple d'un seul objet, avec descripteurs géométriques
6 Classifieur plus évolué
7 Plusieurs objets
8 Références

Technos matérielles et logicielles

Vous utiliserez :

Une Rpi 4 que vous programmerez depuis des postes utilisés en terminaux connectés par ssh, avec redirection graphique (option - X).
Une camera PiCam Wide (grand angle)
Le langage Python accompagné de
- la librairie libcamera pour les acquisitions :
  - https://github.com/raspberrypi/libcamera
  - https://pip-assets.raspberrypi.com/categories/652-raspberry-pi-camera-module-2/documents/RP-008156-DS-2-picamera2-manual.pdf?disposition=inline
- PIL et numpy pour les traitements bas niveaux
- la librairie opencv et dlib pour la classification et la reconnaissance

Étapes :

Connexion à la Rpi et test d'acquisition en ligne de commande
Capture d'image et affichage en temps réel, avec Python
Prétraitement
Reconnaissance simple d'un seul objet, avec descripteurs géométriques
Classifieur plus évolué (knn, svm)
Plusieurs objets

Connexion à la Rpi et test d'acquisition en ligne de commande

Connecter (si cela n'est pas fait) la PiCam à la Rpi4
Dans un terminal, se connecter à la Rpi en ssh : ssh -X root@10.98.33.XX
Tester la PiCam avec libcamera-hello (la capture en video doit s'afficher sur l'écran de la Rpi). Avec les informations affichées, identifier :
- le modèle du capteur,
- ses caractéristiques (résolution, format, cadence, etc ...).
Tester l'acquisition d'image avec l'éxecutable libcamera-still
- Explorer les options de cette application (libcamera-still -h), en particulier -n, --immediate, --width, --height et -o
- Voir la page suivante pour le détails des options possibles : https://www.raspberrypi.com/documentation/computers/camera_software.html

Capture d'image et affichage en temps réel

En exploitant la documentation Picamera2 (principalement section 6 - Capturing images and requests)

Tester les deux exemples Capturing arrays et Capturing PIL images
- PIL fait référence à Python Imaging Library : une bibliothèque Python de traitement d'images.
Écrire un script Python qui :
- initialise la camera
- affiche en continu son image
- sur l'appui d'une touche, réalise une capture (dans un objet array>/code> ou <code>PIL) et sauvegarde l'image dans un fichier

En pratique :

Vous pouvez lancer un interpréteur Python dans le terminal pour tester des choses
Vous pouvez accéder aux dossiers de la Rpi depuis votre PC fixe, depuis le navigateur Dolphin avec comme url sftp://root@10.98.33.83:22/. Ce qui vous permettra par exemple d'éditer le fichier script depuis votre PC fixe.
Dans le terminal, python monscript.py pour executer votre script
Référence Python :
- Le tutoriel Python

Prétraitement

Modification éventuelle de la zone de capture de la camera.
Conversion en image niv. de gris.
Binarisation.

Reconnaissance simple d'un seul objet, avec descripteurs géométriques

En ne plaçant qu'un seul objet dans le champ de la camera, calculer et afficher ses descripteurs de forme : longueur/largeur de l'objet, cf https://raphael.candelier.fr/?blog=Image%20Moments
Construire une décision idoine à l'aide de la largeur et de la longueur de l'ellipse englobante, afin de discrimer trois classes d'objets (par exemple : jeton court, jeton long, jeton rond)

Classifieur plus évolué

Redressement de la perspective
Descripteurs
KNN
SVM

Plusieurs objets

Segmentation

Références

OpenCV :

OpenCV Tutorials
Exemples OpenCV en c++
K-Nearest Neighbour
Image Segmentation with Watershed Algorithm
connected Components et son exemple en cpp : https://docs.opencv.org/3.4/de/d01/samples_2cpp_2connected_components_8cpp-example.html#a3
Introduction to Support Vector Machines
Fourier Descriptors, voir également Contours example pour obtenir les contours d'un objet.

Archives de cette page :

Cours:Classif_archive

@@ Ligne 58 : / Ligne 58 : @@
 === Prétraitement ===
-'''Cette partie est moins guidée, elle devra être incluse dans votre compte-rendu.'''
 * Modification éventuelle de la zone de capture de la camera.
-# Conversion en image niv. de gris.
+* Conversion en image niv. de gris.
-# Binarisation.
+* Binarisation.
-* En ne plaçant qu'un seul objet dans le champ de la camera, calculer et afficher ses descripteurs de forme : longueur/largeur de l'objet, cf https://raphael.candelier.fr/?blog=Image%20Moments
-* Fonction de calcul des descripteurs géométriques (longueur l, largeur w) d'un objet dans une image :
+=== Reconnaissance simple d'un seul objet, avec descripteurs géométriques ===
-<source lang="c++">
-void compute_desc(CImg<> image) {
-    long M00, M10, M01, M11, M20, M02;
-    M00 = 0; M10 = 0; M01 = 0; M11 = 0; M20 = 0; M02 = 0;
-    cimg_forXY(image,x,y) {
-        M00 += image(x,y);
-        M10 += x*image(x,y);
-        M01 += y*image(x,y);
-        M11 += x*y*image(x,y);
-        M20 += x*x*image(x,y);
-        M02 += y*y*image(x,y);
-    }
-    long xm = M10/M00;
-    long ym = M01/M00;
-    long mu20 = M20/M00 - xm*xm;
-    long mu02 = M02/M00 - ym*ym;
-    long mu11 = M11/M00 - xm*ym;
-    long l = sqrt(8 * (mu20 + mu02 + sqrt(4*mu11*mu11 + (mu20-mu02)*(mu20-mu02))));
-    long w = sqrt(8 * (mu20 + mu02 - sqrt(4*mu11*mu11 + (mu20-mu02)*(mu20-mu02))));
-    cout << "l = " << l << endl;
-    cout << "w = " << w << endl;
-}
-</source>
-=== Reconnaissance simple d'un seul objet, avec descripteurs géométriques ===
+* En ne plaçant qu'un seul objet dans le champ de la camera, calculer et afficher ses descripteurs de forme : longueur/largeur de l'objet, cf https://raphael.candelier.fr/?blog=Image%20Moments
+* Construire une décision idoine à l'aide de la largeur et de la longueur de l'ellipse englobante, afin de discrimer trois classes d'objets (par exemple : jeton court, jeton long, jeton rond)
 === Classifieur plus évolué ===
+* Redressement de la perspective
+* Descripteurs
+* KNN
+* SVM
 === Plusieurs objets ===
+* Segmentation
 === Références  ===

Cours:Classif : Différence entre versions

Version actuelle datée du 21 janvier 2026 à 12:28

Sommaire

Technos matérielles et logicielles

Connexion à la Rpi et test d'acquisition en ligne de commande

Capture d'image et affichage en temps réel

Prétraitement

Reconnaissance simple d'un seul objet, avec descripteurs géométriques

Classifieur plus évolué

Plusieurs objets

Références

Menu de navigation

Outils personnels

Espaces de noms

Variantes

Affichages

Plus

Rechercher

Navigation

Outils