Improve readme

This commit is contained in:
Arnaud Vergnet 2022-01-09 11:39:27 +01:00
parent c7b9e02f93
commit a31ad0fd36
2 changed files with 50 additions and 5 deletions

View file

@ -64,7 +64,52 @@ Une variable de configuration supplémentaire est disponible :
Cette partie se lance à l'aide de la commande suivante :
```shell
python3 tp2-dbscan.py
python3 tp3-dbscan.py
```
Ce script possède un fonctionnement analogue aux précédents, mais utilisant un algorithme DBSCAN.
### Mean Shift
Nous devions choisir un autre algorithme en plus des trois précédents. Nous avons donc choisi Mean Shift.
Cette partie se lance à l'aide de la commande suivante :
```shell
python3 tp4-mean-shift.py
```
Ce script possède un fonctionnement analogue aux précédents, mais utilisant un algorithme de Mean Shift.
### Jeu artificiel
Cette partie contient 2 scripts. Le premier sert à trouver un epsilon adapté pour dbscan et se lance avec la commande suivante :
```shell
python3 tp5-preprocessing.py
```
Le deuxième script applique les quatre algorithmes précédents sur une liste de jeux de données et se lance avec la commande suivante :
```shell
python3 tp5-artificial-dataset.py
```
Deux variables de configuration supplémentaire sont disponibles :
- `dataset_name_list`: la liste de datasets à utiliser
- `eps_list`: la liste des epsilon que dbscan doit utiliser pour chaque dataset
dataset_name_list
### Jeu réel
Cette dernière partie se comporte comme la précédente, mais sur un jeu de donnée réel. Un script de pre processing pour trouver le bon epsilon est donc disponible et se lance en utilisant la commande suivante :
```shell
python3 tp6-preprocessing.py
```
Le dernier script permet de lancer les quatre algorithmes précédents sur le jeu de donnée réel, lu depuis un fichier csv. Le script va tout d'abord extraire des colonnes pour réduire le nombre de dimensions de ce jeu de donnée. Le script peut être lancé en utilisant la commande suivante :
```shell
python3 tp6-real-dataset.py
```
Plusieurs variables de configuration supplémentaire sont disponibles :
- `eps`: la valeur d'epsilon à utiliser pour dbscan, identifiée avec le script `tp6-preprocessing.py`
- `first_column`: la première colonne à considérer pour l'extraction du csv
- `last_column`: la dernière colonne à considérer pour l'extraction du csv

View file

@ -6,8 +6,6 @@ Created on Wed Dec 8 16:07:28 2021
@author: pfaure
"""
from numpy import arange
from sklearn.neighbors import NearestNeighbors
import numpy as np
from myplotlib import print_1d_data, print_2d_data
from mydatalib import scale_data, apply_DBSCAN, evaluate, extract_data_csv, apply_kmeans, \
@ -15,12 +13,14 @@ from mydatalib import scale_data, apply_DBSCAN, evaluate, extract_data_csv, appl
path = './new-data/'
dataset_name = "pluie"
save = False
eps = 0.6
first_column = 1
last_column = 12
save = False
print("-----------------------------------------------------------")
print(" Chargement du dataset : " + dataset_name)
(villes, data) = extract_data_csv(path + dataset_name, 1, 12)
(villes, data) = extract_data_csv(path + dataset_name, first_column, last_column)
print(data)