Browse Source

Improve readme

Arnaud Vergnet 2 years ago
parent
commit
a31ad0fd36
2 changed files with 50 additions and 5 deletions
  1. 46
    1
      README.md
  2. 4
    4
      tp6-real-dataset.py

+ 46
- 1
README.md View File

@@ -64,7 +64,52 @@ Une variable de configuration supplémentaire est disponible :
64 64
 
65 65
 Cette partie se lance à l'aide de la commande suivante :
66 66
 ```shell
67
-python3 tp2-dbscan.py
67
+python3 tp3-dbscan.py
68 68
 ```
69 69
 
70 70
 Ce script possède un fonctionnement analogue aux précédents, mais utilisant un algorithme DBSCAN.
71
+
72
+### Mean Shift
73
+
74
+Nous devions choisir un autre algorithme en plus des trois précédents. Nous avons donc choisi Mean Shift. 
75
+Cette partie se lance à l'aide de la commande suivante :
76
+```shell
77
+python3 tp4-mean-shift.py
78
+```
79
+
80
+Ce script possède un fonctionnement analogue aux précédents, mais utilisant un algorithme de Mean Shift.
81
+
82
+### Jeu artificiel
83
+
84
+Cette partie contient 2 scripts. Le premier sert à trouver un epsilon adapté pour dbscan et se lance avec la commande suivante :
85
+```shell
86
+python3 tp5-preprocessing.py
87
+```
88
+
89
+Le deuxième script applique les quatre algorithmes précédents sur une liste de jeux de données et se lance avec la commande suivante :
90
+```shell
91
+python3 tp5-artificial-dataset.py
92
+```
93
+
94
+Deux variables de configuration supplémentaire sont disponibles :
95
+- `dataset_name_list`: la liste de datasets à utiliser
96
+- `eps_list`: la liste des epsilon que dbscan doit utiliser pour chaque dataset
97
+
98
+dataset_name_list
99
+
100
+### Jeu réel
101
+
102
+Cette dernière partie se comporte comme la précédente, mais sur un jeu de donnée réel. Un script de pre processing pour trouver le bon epsilon est donc disponible et se lance en utilisant la commande suivante :
103
+```shell
104
+python3 tp6-preprocessing.py
105
+```
106
+
107
+Le dernier script permet de lancer les quatre algorithmes précédents sur le jeu de donnée réel, lu depuis un fichier csv. Le script va tout d'abord extraire des colonnes pour réduire le nombre de dimensions de ce jeu de donnée. Le script peut être lancé en utilisant la commande suivante :
108
+```shell
109
+python3 tp6-real-dataset.py
110
+```
111
+
112
+Plusieurs variables de configuration supplémentaire sont disponibles :
113
+- `eps`: la valeur d'epsilon à utiliser pour dbscan, identifiée avec le script `tp6-preprocessing.py`
114
+- `first_column`: la première colonne à considérer pour l'extraction du csv
115
+- `last_column`: la dernière colonne à considérer pour l'extraction du csv

+ 4
- 4
tp6-real-dataset.py View File

@@ -6,8 +6,6 @@ Created on Wed Dec  8 16:07:28 2021
6 6
 @author: pfaure
7 7
 """
8 8
 from numpy import arange
9
-from sklearn.neighbors import NearestNeighbors
10
-import numpy as np
11 9
 
12 10
 from myplotlib import print_1d_data, print_2d_data
13 11
 from mydatalib import scale_data, apply_DBSCAN, evaluate, extract_data_csv, apply_kmeans, \
@@ -15,12 +13,14 @@ from mydatalib import scale_data, apply_DBSCAN, evaluate, extract_data_csv, appl
15 13
 
16 14
 path = './new-data/'
17 15
 dataset_name = "pluie"
18
-save = False
19 16
 eps = 0.6
17
+first_column = 1
18
+last_column = 12
19
+save = False
20 20
 
21 21
 print("-----------------------------------------------------------")
22 22
 print("     Chargement du dataset : " + dataset_name)
23
-(villes, data) = extract_data_csv(path + dataset_name, 1, 12)
23
+(villes, data) = extract_data_csv(path + dataset_name, first_column, last_column)
24 24
 
25 25
 print(data)
26 26
 

Loading…
Cancel
Save