on analyse
Find a file
2022-01-08 16:55:24 +01:00
artificial Initial commit V1 2021-11-24 14:16:14 +01:00
.gitignore Amelioration des librairies, fin de la partie clustering agglomeratif 2021-12-03 18:22:15 +01:00
mydatalib.py Ajout DBSCAN 2022-01-06 17:01:07 +01:00
myplotlib.py Amelioration des librairies, fin de la partie clustering agglomeratif 2021-12-03 18:22:15 +01:00
README.md Update file names 2022-01-06 17:04:18 +01:00
requirements.txt Add requirements file 2022-01-06 14:47:11 +01:00
tp1-kmeans.py Clean up scripts 2022-01-08 16:55:24 +01:00
tp2-agglo.py Clean up scripts 2022-01-08 16:55:24 +01:00
tp3-dbscan.py Ajout DBSCAN 2022-01-06 17:01:07 +01:00
tp4-affinity.py Add dummy files 2022-01-06 17:07:47 +01:00
tp5-artificial-dataset.py Add dummy files 2022-01-06 17:07:47 +01:00
tp6-real-dataset.py Add dummy files 2022-01-06 17:07:47 +01:00

5ISS- Analyse et Traitement de Données

Paul Faure - Arnaud Vergnet

Ce dépôt contient les sources utilisées pour le TP de 5ISS en Analyse et Traitement de Données.

Il comprend un fichier par partie de TP (tp1-kmeans.py.py, tp2-agglo.py.py et tp3-dbscan.py) et deux fichiers servant de librairie commune (mydatalib.py pour le traitement de données, myplotlib.py pour l'affichage de graphes).

Installation

Ce TP utilise Python >3.8. Pour démarrer, cloner le dépôt et se déplacer dedans :

git clone https://git.etud.insa-toulouse.fr/vergnet/tp-analyse-donnees.git && cd tp-analyse-donnees

Ensuite créer un environnement virtuel et installer les dépendances :

python3 -m venv ./venv
pip install -r ./requirements.txt

L'environnement est maintenant prêt.

TP1

Ce tp se lance à l'aide de la commande suivante :

python3 tp1-kmeans.py

Il suppose que des jeux de données sont disponibles dans le dossier artificial. Il va tout d'abord créer dans le dossier ./IMG/DATA_VISUALISATION les images associées aux graphes des jeux de données golfball, xclara, et xclara après une mise à l'échelle.

Ensuite, il va appliquer l'algorithme K-Means sur le dataset xclara pour k variant de 2 à 49. Les graphes résultants sont sauvegardés dans ./IMG/k-means/xclara/CLUSTERS. Ce script génère aussi des graphiques sur différentes métriques comme le temps de calcul ou le coefficient de silhouette pour analyser les performances de K-Means. Ces graphiques sont sauvegardés dans ./IMG/k-means/xclara/EVALUATION.

TP2

Ce tp se lance à l'aide de la commande suivante :

python3 tp2-agglo.py

Ce script possède un fonctionnement analogue au précédent, mais utilisant un algorithme agglomerative. Les graphes résultants sont donc sauvegardés dans ./IMG/agglomerative_complete.

TP3

Ce tp se lance à l'aide de la commande suivante :

python3 tp2-dbscan.py

Ce script possède un fonctionnement analogue aux précédents, mais utilisant un algorithme DBSCAN. Les graphes résultants sont donc sauvegardés dans ./IMG/dbscan.