在AWS上构建基于Airflow Hadoop和Spark大数据平台

2024年1月11日

本文介绍了AWS云平台服务EMR Serverless,Airflow托管服务MWAA(Managed Workflows for Apache Airflow),构建了基于AWS云平台的大数据平台,最后以一个实例演示了大数据平台的工作流程。

基于Docker的Hadoop和Spark环境搭建

2023年8月21日

本文主要介绍了如何在docker中快速搭建Hadoop和Spark环境。如果想入门大数据,那么一个Docker环境下的大数据平台是最佳学习方式。