⚙️ Código de manutenção do datalake (metadados e pacotes de acesso) | 📖 Docs: https://basedosdados.github.io/mais/
MIT License
Bot releases are visible (Hide)
Published by mfagundes almost 2 years ago
Published by mfagundes almost 2 years ago
CHANGELOG
Published by lucascr91 about 2 years ago
CHANGELOG
Published by lucascr91 about 2 years ago
CHANGELOG
Published by mfagundes about 2 years ago
Published by lucascr91 about 2 years ago
Published by d116626 over 2 years ago
update_columns
#1188parquet
e parquet.gzip
como formatos de upload para o storage #1188chunck_size
do objeto blob #1188dataset_is_public
, permitindo acessar os dados da tabela de staging #1188Published by lucascr91 over 2 years ago
table.update
para o modo stagingbd.funcoes list_datasets
e bd.list_dataset_table
constatns.config
from_file
ao constatns.config
Published by lucascr91 over 2 years ago
dataset_is_public
#1020 *_staging
agora são privados por default
#1020location
define localização da criação dataset #1020observation_level
, short_description
, etc), matamos campos (e.g. entity
, time_unit
, etc). #1093dataset_id
não ser automaticamente criado em dataset_config.yaml
. #1093columns_config_url
virou columns_config_url_or_path
e agora suporta carregamento de tabela de arquitetura localPublished by JoaoCarabetta almost 3 years ago
PRs:
#1026 Cria bypass de memória --> Agora usuário pode fazer download de bases com qualquer tamanho
#1010 Conserta a descrição do dataset
Published by vmussa almost 3 years ago
Essa pre-release compreende a implementação dos PRs #675, #795 e #847.
As mudanças proveniente de cada um dos PRs são descritas a seguir.
Adiciona módulo metadata.py
com as modificações e funções descritas a seguir.
Elas estão disponíveis tanto a partir da importação do módulo e da classe Metadata
via script ou notebook, tanto como a partir do cliente CLI basedosdados
.
Metadata.create
dataset/table_config.yaml
a partir delesdataset/table_config.yaml
estruturado e sem valores preenchidos para novos datasets e tabelasMetadata.is_updated
Metadata.validate
Metadata.publish
Table
Table.create
usa Metadata.create
para gerar o dataset/table_config.yaml
modes
: header
, auxiliary_files
e architecture
table_approve.py
faz o download das 20 primeiras linhas da table e adiciona na pasta header
do Google Storageuse_bqstorage_api
nas funções de requisição de dados para acelerar o downloadPublished by JoaoCarabetta about 3 years ago
Closes issues #687 and #511
Resolve PR #793
Breve descrição das alterações
Modificações baseadas em https://stackoverflow.com/questions/45300037/cannot-upload-large-file-to-google-cloud-storage
Published by vmussa about 3 years ago
download
Exception
Published by JoaoCarabetta about 3 years ago
Issue #555
Table().table_exits()
Table().append()
para não dar replace na tabelaIssue #522
Issue #578
PR #557
Published by JoaoCarabetta over 3 years ago
CHANGELOG:
Published by d116626 over 3 years ago
Published by JoaoCarabetta over 3 years ago
partitioned
do Table.create(): checa automaticamente se o dado é particionadotimeout
ao tentar ler uma tabela do BigQueryPublished by Hellcassius over 3 years ago
Published by Hellcassius over 3 years ago
Add new metadata functions to CLI:
list
datasets
list
dataset_tables
get
dataset_description
get
table_description
get
table_columns