DataBrew Pre-Lab

Setup

Trong bài lab này, chúng ta sẽ sử dụng AWS Glue DataBrew để khám phá dữ liệu trong S3, làm sạch và chuẩn bị dữ liêu. Đầu tiên chúng ta phải tạo 1 IAM role để sử dụng trong DataBrew và cho kết quả trong S3 bucket từ DataBrew jobs.

  1. Click vào đây để deploy CloudFormation Stack: Deploy To AWS

  2. Sau khi deploy stack thành công. Nhấn Output để xem các thông tin

Clean

Ta sẽ sử dụng các tham số DatasetS3Path, DataBrewLabRole and DataBrewOutputS3Bucket trong bài lab này.