Cours:BUTiot TNS : Différence entre versions
(→Lecture des données d'entrainement et apprentissage) |
(→Lecture des données d'entrainement et apprentissage) |
||
Ligne 13 : | Ligne 13 : | ||
* Source des données : https://www.kaggle.com/datasets/rishitdagli/anomaly-detection-sample-dataset | * Source des données : https://www.kaggle.com/datasets/rishitdagli/anomaly-detection-sample-dataset | ||
− | + | {{q| a)}} À faire : | |
* Créer une nouvelle "application" node.js | * Créer une nouvelle "application" node.js | ||
* Télécharger le zip des données, décompresser, placer les deux fichiers <code>tr_server_data.csv</code> et <code>gt_server_data.csv</code> dans le dossier de l'application. | * Télécharger le zip des données, décompresser, placer les deux fichiers <code>tr_server_data.csv</code> et <code>gt_server_data.csv</code> dans le dossier de l'application. | ||
Ligne 51 : | Ligne 51 : | ||
} | } | ||
</source> | </source> | ||
+ | |||
+ | {{q| b)}} Évaluer les performances de ce classifieur KNN (1 plus proche voisin) en construisant la matrice de confusion (cf https://fr.wikipedia.org/wiki/Matrice_de_confusion) | ||
+ | {{q| c}} Évaluer les performances de ce classifieur KNN (3 plus proche voisin) en construisant la matrice de confusion | ||
=== Classification temps réel === | === Classification temps réel === |
Version du 5 février 2024 à 14:29
Classification multivariée temps réel
Le travail de cette étape va consister à
- lire des données temps réel caractérisant l'état d'un réseau (latence et débit)
- A partir d'un ensemble de données d'entrainement, mettre en place un classifieur permettant de détecter des anomalies sur ce réseau
Lecture des données d'entrainement et apprentissage
- Source des données : https://www.kaggle.com/datasets/rishitdagli/anomaly-detection-sample-dataset
a) À faire :
- Créer une nouvelle "application" node.js
- Télécharger le zip des données, décompresser, placer les deux fichiers
tr_server_data.csv
etgt_server_data.csv
dans le dossier de l'application. - Lire ces données au format CSV, par exemple avec :
const fs = require("node:fs");
// training
let tr = fs.readFileSync("tr_server_data.csv", "utf-8")
.split('\n') // découpe des lignes
.map(l => l.split(',').map (v => parseFloat(v))); // découpe autour de la virgule et conv. en flottant
tr.pop(); // Les deux dernières lignes sont à rejeter.
tr.pop();
- Mise en place du classifieur KNN (entrainement et test):
const knnClassifier = require('@tensorflow-models/knn-classifier');
const tf = require('@tensorflow/tfjs');
// Create the classifier.
const classifier = knnClassifier.create();
// Train the classifier
for (let k = 0; k < gt.length; k++) {
classifier.addExample(
tf.tensor(tr[k]),
gt[k]
);
}
// Test the classifier
for (let k = 0; k < gt.length; k++) {
classifier.predictClass(
tf.tensor(tr[k]),
1
).then(v => console.log(v.classIndex + " / " + gt[k]));
}
b) Évaluer les performances de ce classifieur KNN (1 plus proche voisin) en construisant la matrice de confusion (cf https://fr.wikipedia.org/wiki/Matrice_de_confusion) c Évaluer les performances de ce classifieur KNN (3 plus proche voisin) en construisant la matrice de confusion
Classification temps réel
- Données publiées sur le broker habituel :
-
data/latence
en ms -
data/debit
en mb/s -
data/gt
= ground truth (vérité terrain) : est-ce une anomalie ?
-
A faire (en node.js) :
- lire ces données avec mqtt