Generalist E-Commerce model for testing data pipelines and projects best practices
MIT License
Apache Spark Connector for Azure Cosmos DB
Projeto que completa a criação de um ambiente para extração, armazenamento e processamento de dad...
Master's thesis on Big Data
Simple and Distributed Machine Learning
Apache Software Foundation Parent POM
Data science Python notebooks: Deep learning (TensorFlow, Theano, Caffe, Keras), scikit-learn, Ka...
Apache OpenDAL: access data freely.
scala、spark使用过程中,各种测试用例以及相关资料整理
Repositorio modelo para desenvolvimento do projeto final da disciplina de Engenharia de Dados do ...
Apache Druid: a high performance real-time analytics database.
Desenvolvimento de uma Pipeline de Dados utilizando Azure Synapse
High performance data store solution
Apache Spark 官方文档中文版
Scala toolchain for InfluxDB
Big Data Ecosystem Docker