Skip to content

dorianb/Machine-learning-spark

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Machine-learning-spark

Exoplanets classification with spark ml

La ligne de commande suivante permet de sousmettre un job spark pour l'entraînement du modèle de classification d'exoplanètes:

./spark-submit --conf spark.eventLog.enabled=true \
 --conf spark.eventLog.dir="/tmp" --driver-memory 2G --executor-memory 6G \
 --class com.sparkProject.JobML --master spark://dorian-N56VB:7077 \
 "/path_to_project/target/scala-2.11/tp_spark-assembly-1.0.jar" \
 "-p" "/path_to_input_and_output_files/" \
 "-i" "input_file.parquet" \
 "-o" "output_file.model"

Plusieurs paramètres sont à renseigner:

-p <le chemin vers le dossier contenant le fichier d'entrée et le fichier de sortie>
-i <nom du fichier d'entrée au format parquet, correspond aux données d'entrainement nettoyées>
-o <nom fichier de sortie au format model, correspond aux modèle entrâiné à persister>

About

Exoplanet classification with spark ml

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages