Athena and QuickSight

Step

  • Yêu cầu
  • Bắt đầu
  • Truy vấn data với Amazon Athena
  • Dựng Amazon QuickSight Dashboard
  • Set up QuickSight
  • Tạo QuickSight Charts
  • Tạo QuickSight Parameters
  • Tạo QuickSight Filter
  • Thêm Calculated Fields
  • Amazon QuickSight ML-Insights (Optional)
  • Athena Workgroups to Control Query Access and Costs (Optional)
  • Workflow setup to separate workloads
  • Explore the features of workgroups
  • Managing Query Usage and Cost
  • Sử dụng tag để phân bổ chi phí

Yêu cầu

Hoàn thành Ingestion with DMSTransforming data with Glue ETL labs.

Bắt đẩu

Trong bài lab này, chúng ta sẽ hoàn thành các task sau:

  1. Truy vấn dữ liệu và tạo view với Amazon Athena
  2. Athena Workgroups để Điều khiển query access và costs
  3. Dựng dashboard với Amazon QuickSight

Truy vấn dữ liệu với Amazon Athena

  1. Truy cập Athena

Athena

  1. Chọn database “ticketdata” Athena

  2. Chọn table “parquet_sporting_event_ticket” để xem các trường

  3. Copy đoạn SQL sau và nhấn Run

SELECT
e.id AS event_id,
e.sport_type_name AS sport,
e.start_date_time AS event_date_time,
h.name AS home_team,
a.name AS away_team,
l.name AS location,
l.city
FROM parquet_sporting_event e,
parquet_sport_team h,
parquet_sport_team a,
parquet_sport_location l
WHERE
e.home_team_id = h.id
AND e.away_team_id = a.id
AND e.location_id = l.id;

Kết quả như sau:

Athena Athena

  1. Chọn CreateView from query

  2. Đặt tên view là sporting_event_info vào click Create Athena

View đã được khởi tạo Athena

  1. Copy đoạn Sql sau sang một tab mới
SELECT t.id AS ticket_id,
e.event_id,
e.sport,
e.event_date_time,
e.home_team,
e.away_team,
e.location,
e.city,
t.seat_level,
t.seat_section,
t.seat_row,
t.seat,
t.ticket_price,
p.full_name AS ticketholder
FROM sporting_event_info e,
parquet_sporting_event_ticket t,
parquet_person p
WHERE
t.sporting_event_id = e.event_id
AND t.ticketholder_id = p.id

Athena

  1. Lưu lại với tên: create_view_sporting_event_ticket_info Athena

Click Run

Athena

Kết quả xuất hiện như sau: Athena

  1. Đặt tên view là: sporting_event_ticket_info và click Create Athena

  2. Copy đoạn Sql sau sang một tab mới

SELECT
sport,
count(distinct location) as locations,
count(distinct event_id) as events,
count(*) as tickets,
avg(ticket_price) as avg_ticket_price
FROM sporting_event_ticket_info
GROUP BY 1
ORDER BY 1;

Lưu với tên là: analytics_sporting_event_ticket_info Athena

Click Run

Athena

Build an Amazon QuickSight Dashboard

Set up QuickSight

  1. Truy cập QuickSight Athena

  2. Sign up for QuickSight.

Athena

  1. Chọn Enterprise Version

  2. Continue Athena

  3. Chọn No, Maybe Later, Ở màn hình mới để mặc định.

  4. Chọn region và check vào các box, enable auto discovery, Amazon Athena, and Amazon S3. Nhập tên và email cho account QuickSight

  5. Chọn DMS bucket và chọn Finish

Athena

Athena

Nhấn Finish

  1. Chọn New analysis Athena

  2. Chọn New dataset Athena

  3. Tại màn Create a Dataset, chọn Athena

Athena

  1. Data source name: ticketdata-qs, và chọn Validate connection

  2. Click Create data source Athena

  3. Chọn database ticketdata

  4. Chọn bảng sporting_event_ticket_info và nhấn Select

Athena

  1. Chọn option Import to SPICE for quicker analytics và nhấn Visualize.

Athena

Chúng ta có thể quan sát thấy QuickSight Visualize interface và bắt đầu xây dựng dashboard

Athena

Tạo QuickSight Charts

Trong phần này chúng ta sẽ cùng tìm hiểu các loại chart

  1. Chọn cột ticket_price để tạo chart.

  2. Chọn expand icon và chọn Show as Currency Athena

  3. Click Add button từ Visuals pane

  • Visual types: Vertical bar chart
  • X-axis Fields list chọn event_date_time
  • Y-axis chọn ticket_price từ Field list.

Athena

  1. Bạn có thể kéo và di chuyển các hình ảnh khác để điều chỉnh không gian trong trang tổng quan. Trong danh sách Trường, nhấp và kéo trường Seat_level vào hộp Nhóm/Màu. Bạn cũng có thể sử dụng thanh trượt bên dưới trục x để vừa với tất cả dữ liệu.

Athena

  1. Trong Visuals pane, chọn Vertical bar chartClustered bar combo chart icon

  2. Tại Fields list, chọn ticketholder

  3. Tại Lines box, chọn Aggregate: Count Distinct.

Athena

  1. Chọn insight icon

Athena

Tạo QuickSight Parameters

Trong phần này chúng ta sẽ tạo parameters cho dashboard và thêm filter.

  1. Chọn Parameters từ tool bar

Athena

  1. Chọn Add để tạo parameter

  2. Đặt tên là EventFrom

  3. Chọn Data type là Datetime

  4. Time granularity là Hour

  5. Hãy chọn giá trị từ lịch làm ngày bắt đầu có sẵn trong biểu đồ của bạn cho event_date_time

  6. Chọn Create và đóng dialog Athena

  7. Tạo thêm parameter với thông số sau:

  • Name: EventTo
  • Chọn Data type là Datetime
  • Time granularity là Hour
  • Hãy chọn giá trị từ lịch làm ngày bắt đầu có sẵn trong biểu đồ của bạn cho event_date_time
  • Click Create

Athena

  1. Trong màn hình tiếp theo. Click vào 3 chấm của EventFrom parameter và chọn Add control

Athena

  1. Nhập name là Event From và nhấn Add Athena

  2. Tương tự với EventTo Athena

Bây giờ bạn có thể xem và mở rộng phần Kiểm soát phía trên biểu đồ.

Athena

Tạo QuickSight Filter

  1. Chọn Filter
  2. Click (+) để thêm filter event_date_time

Athena

  1. Chọn edit Athena

  2. Chọn All applicable visualsApplied To dropdown

  3. Filter type chọn Date & Time range và Condition là Between

  4. Chọn option Use Parameter, chọn Yes

  5. Start date parameter: EventFrom

  6. End date parameter: EventTo Athena

  7. Click Apply.

Thêm Calculated Fields

  1. Chọn Add Calculated Field Athena

  2. Nhập name là: event_day_of_week

  3. Formula: extract(‘WD’,{event_date_time})

  4. Click Save Athena

  5. Thêm một trường được tính toán khác với các thuộc tính sau:

  • Calculated field name: event_hour_of_day
  • Formula: extract(‘HH’,{event_date_time})
  1. Chọn Visualize icon từ the Tool bar và nhấn Add visual

Athena

  1. Field type" scatter plot

  2. Tại Fields list, Chọn các thuộc tính sau:

  • X-axis: “event_hour_of_day”
  • Y-axis: “event_day_of_week”
  • Size: “ticket_price” Athena

Pushlish hoặc Share Athena

Dashboard là ảnh chụp nhanh phân tích chỉ đọc mà bạn có thể chia sẻ với những người dùng Amazon QuickSight khác nhằm mục đích báo cáo. Trong Dashboard, những người dùng khác vẫn có thể xem hình ảnh và dữ liệu nhưng điều đó sẽ không sửa đổi tập dữ liệu.

Bạn có thể chia sẻ phân tích với một hoặc nhiều người dùng khác mà bạn muốn cộng tác để tạo hình ảnh. Phân tích cung cấp các cách sử dụng khác để ghi và sửa đổi tập dữ liệu.

Cost Allocation Tags

Khi bạn tạo hai nhóm làm việc: nhóm làm việcA và nhóm làm việcB, bạn cũng đã tạo tên dưới dạng thẻ. Các thẻ này có thể được sử dụng trong bảng điều khiển Quản lý chi phí và thanh toán để xác định mức sử dụng cho mỗi nhóm làm việc.

Ví dụ: bạn có thể tạo một bộ thẻ cho nhóm làm việc trong tài khoản của mình để giúp bạn theo dõi chủ sở hữu nhóm làm việc hoặc xác định nhóm làm việc theo mục đích của họ. Bạn có thể xem các thẻ cho một nhóm làm việc trong trang “Xem chi tiết” cho nhóm làm việc đang được xem xét.

Bạn có thể thêm tag sau khi đã tạo workgroup. Để tạo tag:

  1. Athena console, chọn tab Workgroups và chọn workgroup.
  2. Chọn tab tags.
  3. Trên tab tags, bấm vào Manage tags, sau đó chỉ định key và value cho tag.
  4. Khi bạn hoàn tất, hãy nhấp vào Save Changes.

Athena