Open Source Ecosystems

big-data-mapreduce-course

Big Data Modeling, MapReduce, Spark, PySpark @ Santa Clara University

04 Dec 2014 150

spark_engine

Build a complex spark execution plan by composing many different spark operations.

26 Apr 2020 1

spark-fits

FITS data source for Spark SQL and DataFrames

31 Jan 2018 20

scala-spark-tutorial

Project for James' Apache Spark with Scala course

01 Apr 2017 127

bigdata-growth

大数据知识仓库涉及到数据仓库建模、实时计算、大数据、数据中台、系统设计、Java、算法等。

10 Jun 2020 1,443

data-algorithms-book

MapReduce, Spark, Java, and Scala for Data Algorithms Book

06 Aug 2014 1,064

SparkPythonBigData

Big-Data with Apache Spark and Python.

23 Jun 2024 0

BigDataGuide

大数据学习，从零开始学习大数据，包含大数据学习各阶段学习视频、面试资料

30 Nov 2019 2,665

sparkini

base docker compose to setup the data engineering env in local

21 Jul 2024 0

utils4s

scala、spark使用过程中，各种测试用例以及相关资料整理

24 Sep 2015 1,089

apache-spark-docker

Dockerizing an Apache Spark Standalone Cluster

19 Jul 2021 40

daph

Daph是一个通用的数据同步与数据处理平台级工具，既具有丰富的数据同步能力，又具有强大的数据处理能力，一站式满足数据开发所有需求，可用于构建可视化配置化的数据同步与数据处理平台。

09 Sep 2024 8

BigData-skillTree

Spark、flink、HBase、Hive、flume集成了一些Hadoop的原生api的一些demo（如HDFS、MapReduce：目前就这两个）；同时测试一些异常功能

27 Aug 2018 16

hadoop_system

✅ hadoop eco system을 구성하고 파이프라인 제작합니다.

14 Aug 2024 2

Sales-Analytics-Pipeline

Data analytics pipeline built with Apache Spark and Hadoop for processing and analyzing large-sca...

17 Jul 2024 0

cdhproject

Related Projects