hadoop各组件使用,持续更新
No README available, please check again later.
Big Data Modeling, MapReduce, Spark, PySpark @ Santa Clara University
Build a complex spark execution plan by composing many different spark operations.
FITS data source for Spark SQL and DataFrames
Project for James' Apache Spark with Scala course
大数据知识仓库涉及到数据仓库建模、实时计算、大数据、数据中台、系统设计、Java、算法等。
MapReduce, Spark, Java, and Scala for Data Algorithms Book
Big-Data with Apache Spark and Python.
大数据学习,从零开始学习大数据,包含大数据学习各阶段学习视频、面试资料
base docker compose to setup the data engineering env in local
scala、spark使用过程中,各种测试用例以及相关资料整理
Dockerizing an Apache Spark Standalone Cluster
Daph是一个通用的数据同步与数据处理平台级工具,既具有丰富的数据同步能力,又具有强大的数据处理能力,一站式满足数据开发所有需求,可用于构建可视化配置化的数据同步与数据处理平台。
Spark、flink、HBase、Hive、flume集成了一些Hadoop的原生api的一些demo(如HDFS、MapReduce:目前就这两个);同时测试一些异常功能
✅ hadoop eco system을 구성하고 파이프라인 제작합니다.
Data analytics pipeline built with Apache Spark and Hadoop for processing and analyzing large-sca...