😀
Tech Note
  • Học trở thành Data Engineer
  • Data Engineering Roadmap
  • Chương 1: Dữ liệu thô
    • Array với numpy
    • Empowering data analysis with pandas
    • Data cleansing
    • Data operations
    • Tổng kết
  • Chương 2: Data Pipeline
    • Lambda architecture
    • Data Pipeline trên GCP
    • Data Pipeline trên AWS
  • Chương 3: Công cụ, framework
    • Apache Spark
    • Apache Kafka
    • Apache Airflow
Powered by GitBook
On this page

Was this helpful?

  1. Chương 2: Data Pipeline

Data Pipeline trên AWS

Thiết kế và xây dựng một Data Pipeline đơn giản trên AWS, sử dụng các service như S3 (lưu trữ), EMR (xử lý dữ liệu batch, lớn), AWS Data Pipeline, Cloudwatch để monitor, ...

PreviousData Pipeline trên GCPNextApache Spark

Last updated 5 years ago

Was this helpful?

Đang cập nhật, đọc tạm ở đây:

https://talk.duyet.net/data-pipeline-aws/design-datapipeline-aws.pdf