Skip to content

Latest commit

 

History

History
 
 

filtrarDados

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 

Geração de dataset com filtro (ENEM 2019)

Esta aplicação gera um dataset filtrado baseando-se em uma query passada por argumento.

Exemplo:

$ python3 generate_sample.py --query-expr "CO_ESCOLA == 25061720"

downloading...
MICRODADOS_ENEM_2019.c 100%[===========================>] 402,35M  3,33MB/s    em 2m 9s
extracting...
generating dataset...
done

O dataset filtrado é salvo em MICRODADOS_ENEM_2019_FILTERED.csv.

Obs: os microdados do ENEM2019 (que possuem 3.2GB) foram divididos em vários pedaços, então esta ferramenta funciona até em computadores com pouca memória RAM (o meu, por exemplo, tem 3GB de RAM).