Esta aplicação gera um dataset filtrado baseando-se em uma query passada por argumento.
Exemplo:
$ python3 generate_sample.py --query-expr "CO_ESCOLA == 25061720"
downloading...
MICRODADOS_ENEM_2019.c 100%[===========================>] 402,35M 3,33MB/s em 2m 9s
extracting...
generating dataset...
done
O dataset filtrado é salvo em MICRODADOS_ENEM_2019_FILTERED.csv.
Obs: os microdados do ENEM2019 (que possuem 3.2GB) foram divididos em vários pedaços, então esta ferramenta funciona até em computadores com pouca memória RAM (o meu, por exemplo, tem 3GB de RAM).