Improve readme

2022-01-09 11:39:27 +01:00 · 2022-01-09 11:39:27 +01:00 · a31ad0fd36
commit a31ad0fd36
parent c7b9e02f93
2 changed files with 50 additions and 5 deletions
--- a/README.md
+++ b/README.md
@ -64,7 +64,52 @@ Une variable de configuration supplémentaire est disponible :

 Cette partie se lance à l'aide de la commande suivante :
 ```shell
-python3 tp2-dbscan.py
+python3 tp3-dbscan.py
 ```

 Ce script possède un fonctionnement analogue aux précédents, mais utilisant un algorithme DBSCAN.
+
+### Mean Shift
+
+Nous devions choisir un autre algorithme en plus des trois précédents. Nous avons donc choisi Mean Shift. 
+Cette partie se lance à l'aide de la commande suivante :
+```shell
+python3 tp4-mean-shift.py
+```
+
+Ce script possède un fonctionnement analogue aux précédents, mais utilisant un algorithme de Mean Shift.
+
+### Jeu artificiel
+
+Cette partie contient 2 scripts. Le premier sert à trouver un epsilon adapté pour dbscan et se lance avec la commande suivante :
+```shell
+python3 tp5-preprocessing.py
+```
+
+Le deuxième script applique les quatre algorithmes précédents sur une liste de jeux de données et se lance avec la commande suivante :
+```shell
+python3 tp5-artificial-dataset.py
+```
+
+Deux variables de configuration supplémentaire sont disponibles :
+- `dataset_name_list`: la liste de datasets à utiliser
+- `eps_list`: la liste des epsilon que dbscan doit utiliser pour chaque dataset
+
+dataset_name_list
+
+### Jeu réel
+
+Cette dernière partie se comporte comme la précédente, mais sur un jeu de donnée réel. Un script de pre processing pour trouver le bon epsilon est donc disponible et se lance en utilisant la commande suivante :
+```shell
+python3 tp6-preprocessing.py
+```
+
+Le dernier script permet de lancer les quatre algorithmes précédents sur le jeu de donnée réel, lu depuis un fichier csv. Le script va tout d'abord extraire des colonnes pour réduire le nombre de dimensions de ce jeu de donnée. Le script peut être lancé en utilisant la commande suivante :
+```shell
+python3 tp6-real-dataset.py
+```
+
+Plusieurs variables de configuration supplémentaire sont disponibles :
+- `eps`: la valeur d'epsilon à utiliser pour dbscan, identifiée avec le script `tp6-preprocessing.py`
+- `first_column`: la première colonne à considérer pour l'extraction du csv
+- `last_column`: la dernière colonne à considérer pour l'extraction du csv
--- a/tp6-real-dataset.py
+++ b/tp6-real-dataset.py
@ -6,8 +6,6 @@ Created on Wed Dec  8 16:07:28 2021
@author: pfaure
 """
 from numpy import arange
-from sklearn.neighbors import NearestNeighbors
-import numpy as np

 from myplotlib import print_1d_data, print_2d_data
 from mydatalib import scale_data, apply_DBSCAN, evaluate, extract_data_csv, apply_kmeans, \
@ -15,12 +13,14 @@ from mydatalib import scale_data, apply_DBSCAN, evaluate, extract_data_csv, appl

 path = './new-data/'
 dataset_name = "pluie"
-save = False
 eps = 0.6
+first_column = 1
+last_column = 12
+save = False

 print("-----------------------------------------------------------")
 print("     Chargement du dataset : " + dataset_name)
-(villes, data) = extract_data_csv(path + dataset_name, 1, 12)
+(villes, data) = extract_data_csv(path + dataset_name, first_column, last_column)

 print(data)