Sistema de gestión y procesamiento de datos para PictoNet. Maneja la recolección, limpieza y preparación de datasets para el entrenamiento.
quickdraw.py
: Integración con Google Quick Draw Datasetarasaac.py
: Colector de pictogramas ARASAACopenmoji.py
: Procesamiento de OpenMoji
svg_cleaner.py
: Limpieza y normalización de SVGsnormalizer.py
: Estandarización de formatos
generator.py
: Generación de datasets de entrenamientovalidator.py
: Validación de calidad de datos
labels.json
: Etiquetas y categoríasmappings.json
: Mapeos entre conceptos y pictogramas
- Google Quick Draw Dataset
- ARASAAC
- OpenMoji
- Material Design Icons
poetry install
from pictonet_data.collectors import QuickDrawCollector
from pictonet_data.processors import SVGCleaner
# Recolectar datos
collector = QuickDrawCollector()
raw_data = collector.collect("chair")
# Procesar SVGs
cleaner = SVGCleaner()
processed_data = cleaner.clean(raw_data)
- Recolección de fuentes múltiples
- Limpieza y normalización
- Validación de calidad
- Generación de dataset final