gastos-deputados

Script que baixa, extrai e limpa dados de gastos da cota parlamentar

LGPL-3.0 License

Stars
24

Gastos Deputados

Script que baixa os ZIPs relativos a gastos da cota parlamentar do site da Cmara dos Deputados, descompacta, extrai e limpa os registros e converte em um nico CSV.

Licena e Citao

A licena do cdigo LGPL3 e dos dados convertidos Creative Commons Attribution ShareAlike. Caso utilize os dados, cite a fonte original e quem tratou os dados e caso compartilhe os dados, utilize a mesma licena. Exemplo de como os dados podem ser citados: Fonte: Portal da Transparncia da Cmara dos Deputados, dados tratados por lvaro Justen/Brasil.IO

Dados

Depois de coletados e checados os dados ficam disponveis de 3 formas no Brasil.IO:

Se esse programa e/ou os dados resultantes foram teis a voc ou sua empresa, considere fazer uma doao ao projeto Brasil.IO, que mantido voluntariamente.

Instalando

Requer Python 3.7.

pip install -r requirements.txt

Executando

Para capturar todos os anos:

./run.sh

Voc tambm pode executar diretamente o spider do scrapy:

scrapy runspider camara_federal.py --loglevel=INFO -o cota-parlamentar-camara-federal.csv

Caso queira apenas alguns anos, passe o parmetro -a years=XXX, com os valores separados por vrgula, exemplo:

scrapy runspider camara_federal.py -a years=2015,2016,2017,2018 --loglevel=INFO -o cota-parlamentar-2015-2018.csv

Trabalhando com os dados

Voc pode utilizar a interface de linha de comando da rows para converter os dados gerados em CSV para um banco de dados SQLite - dessa forma a anlise dos dados pode ser feita em cima do banco de dados gerado usando SQL.

rows csv2sqlite --schemas=schema/cota-parlamentar.csv data/output/cota-parlamentar.csv.gz data/gastos.sqlite
Related Projects