ราคาของ Amazon Athena
ทำไมถึงต้องเลือกใช้ Athena
Amazon Athena เป็นบริการวิเคราะห์เชิงโต้ตอบแบบไม่ต้องใช้เซิร์ฟเวอร์ที่สร้างขึ้นบนเฟรมเวิร์กแบบโอเพนซอร์สที่ช่วยให้คุณสามารถวิเคราะห์ข้อมูลในระดับเพตะไบต์ได้ ด้วย Athena คุณสามารถใช้ SQL หรือ Apache Spark โดยไม่มีโครงสร้างพื้นฐานให้ตั้งค่าหรือจัดการ เรื่องราคาไม่ซับซ้อน คุณจะจ่ายตามข้อมูลที่ประมวลผลหรือที่ใช้ประมวลผล
หากต้องการเริ่มต้น คุณต้องสร้างเวิร์กกรุ๊ปที่จะอนุญาตให้คุณสามารถระบุเครื่องมือการสืบค้นข้อมูล ไดเร็กทอรีการทำงานของคุณใน Amazon Simple Storage Service (S3) เพื่อเก็บผลลัพธ์ของการดำเนินการ บทบาท AWS Identity and Access Management (IAM) (หากจำเป็น) และแท็กทรัพยากรของคุณ คุณสามารถใช้เวิร์กกรุ๊ปเพื่อแยกผู้ใช้ ทีม แอปพลิเคชัน หรือเวิร์กโหลด กำหนดขีดจำกัดของจำนวนข้อมูลที่แต่ละการสืบค้นข้อมูลหรือทั้งเวิร์กกรุ๊ปสามารถประมวลผลได้ และตรวจสอบค่าใช้จ่ายต่างๆ คุณสามารถ (ก) เรียกใช้ SQL queries และรับข้อมูลที่สแกนหรือใช้ประมวลผล หรือ (ข) เรียกใช้โค้ด Apache Spark Python และระบบจะเรียกเก็บเงินเป็นอัตรารายชั่วโมงสำหรับการดำเนินการโค้ดของคุณตามเวิร์กกรุ๊ปที่คุณสร้างขึ้น
เครื่องมือคำนวณค่าบริการของ AWS
คำนวณค่าใช้จ่ายสำหรับ Amazon Athena และสถาปัตยกรรมของคุณด้วยการประมาณราคาเพียงครั้งเดียว
SQL queries
การสืบค้นข้อมูล SQL พร้อมการสำรองปริมาณการประมวลผล
Apache Spark
ค่าใช้จ่ายเพิ่มเติม
Athena จะสืบค้นข้อมูลโดยตรงจาก Amazon S3 ไม่มีค่าบริการพื้นที่จัดเก็บเพิ่มเติมสำหรับการสืบค้นข้อมูลของคุณด้วย Athena คุณจะเสียค่าบริการ S3 ในอัตรามาตรฐานสำหรับพื้นที่จัดเก็บ คำขอ และการโอนถ่ายข้อมูล ตามค่าเริ่มต้น ผลการสืบค้นจัดเก็บอยู่ในบัคเก็ต S3 ที่คุณเลือกและยังมีการเรียกเก็บค่าบริการตามอัตรา S3 แบบมาตรฐาน
- S3 จะเรียกเก็บเงินเมื่อเวิร์กโหลดอ่าน จัดเก็บ และถ่ายโอนข้อมูล ซึ่งรวมถึงการสืบค้นที่สำเร็จและไม่สำเร็จ ตามค่าเริ่มต้น ผลของ SQL Query และผลการคำนวณ Spark จะจัดเก็บอยู่ในบัคเก็ต S3 ที่คุณเลือก โดยมีการเรียกเก็บค่าบริการตามอัตรา S3 มาตรฐาน ดูข้อมูลเพิ่มเติมได้ที่ราคา Amazon S3
- หากคุณใช้แค็ตตาล็อกข้อมูลของ AWS Glue กับ Athena จะมีการเรียกเก็บค่าบริการตามอัตราแค็ตตาล็อกข้อมูลของ AWS Glue แบบมาตรฐาน ดูรายละเอียดได้ที่หน้าราคา AWS Glue
- SQL queries บนแหล่งที่มาของข้อมูล (ข้อมูลไม่ได้จัดเก็บใน S3) จะถูกเรียกเก็บค่าบริการต่อเทราไบต์ (TB) ที่สแกนโดย Athena ที่รวบรวมจากแหล่งที่มาของข้อมูลต่าง ๆ โดยปัดขึ้นเป็นเมกะไบต์ที่ใกล้ที่สุดด้วยขั้นต่ำ 10 เมกะไบต์ต่อการสืบค้น เว้นแต่จะใช้ความจุที่จัดสรรไว้ นอกจากนี้ การสืบค้นข้อมูลดังกล่าวยังมีการเรียกใช้ฟังก์ชัน AWS Lambda ในบัญชีของคุณ คุณจึงถูกเรียกเก็บเงินสำหรับการใช้ Lambda ในอัตรามาตรฐาน ฟังก์ชัน Lambda ที่เรียกใช้โดยคิวรีภายนอกจะเป็นไปตาม Free Tier ของ Lambda ดูรายละเอียดได้ที่ หน้าราคา Lambda
ตัวอย่างราคา
ตัวอย่างที่ 1 – SQL Query
ลองพิจารณาตารางที่มีคอลัมน์ขนาดเท่ากัน 4 คอลัมน์ที่จัดเก็บไว้ใน Amazon S3 เป็นไฟล์ข้อความแบบไม่บีบอัด โดยมีขนาดรวม 3 TB การเปิดใช้การสืบค้นข้อมูลเพื่อรับข้อมูลจากคอลัมน์หนึ่งของตารางต้องใช้ Amazon Athena ในการสแกนทั้งไฟล์ เนื่องจากไม่สามารถแยกข้อความได้
- การสืบค้นนี้จะมีค่าบริการ: 15 USD (ราคาสำหรับการสแกนข้อมูล 3 TB คือ 3 * 5 USD/TB = 15 USD)
หากคุณบีบอัดไฟล์โดยใช้ GZIP คุณอาจได้รับอัตราการบีบอัดที่ 3:1 ในกรณีนี้ คุณจะมีไฟล์บีบอัดขนาด 1 TB การสืบค้นเดียวกันบนไฟล์นี้จะมีค่าบริการ 5 USD Athena ต้องสแกนทั้งไฟล์อีกครั้ง แต่เนื่องจากมีขนาดเล็กลง 3 เท่า คุณจึงจ่ายแค่หนึ่งในสามของการสืบค้นก่อนหน้า หากคุณบีบอัดไฟล์และแปลงไฟล์เป็นรูปแบบคอลัมน์ด้วย เช่น Apache Parquet โดยมีอัตราการบีบอัด 3:1 คุณจะยังได้รับข้อมูลขนาด 1 TB บน S3 แต่ในกรณีนี้ เนื่องจาก Parquet เป็นข้อมูลรูปแบบคอลัมน์ Athena สามารถอ่านได้เฉพาะคอลัมน์ที่มีความเกี่ยวข้องกับการสืบค้นที่เรียกใช้ เนื่องจากการสืบค้นดังกล่าวอ้างอิงเฉพาะคอลัมน์เดียว Athena จะอ่านเฉพาะคอลัมน์นั้นและอาจจะหลีกเลี่ยงการอ่านข้อมูลสามในสี่ของทั้งไฟล์ เนื่องจาก Athena อ่านเพียงหนึ่งในสี่ของไฟล์ จึงสแกนข้อมูลจาก S3 เพียง 0.25 TB
- การสืบค้นนี้จะมีค่าบริการ: 1.25 USD ประหยัดค่าใช้จ่ายขึ้น 3 เท่าด้วยการบีบอัดและประหยัดค่าใช้จ่ายขึ้น 4 เท่าสำหรับการอ่านข้อมูลเพียงคอลัมน์เดียว
(ขนาดไฟล์ = 3 TB/3 = 1 TB ข้อมูลที่สแกนเมื่ออ่านเพียงคอลัมน์เดียว = 1TB/4 = 0.25 TB ราคาสำหรับ 0.25 TB = 0.25 * 5 USD/TB = 1.25 USD)
ตัวอย่างที่ 2 - การสืบค้นข้อมูล SQL พร้อมการสำรองปริมาณการประมวลผล
สมมติว่าทีมของคุณรองรับแอปพลิเคชันข่าวกรองธุรกิจที่ให้การวิเคราะห์บริการตนเองแก่ผู้ใช้ในช่วงเวลาทำการ คุณวิเคราะห์รูปแบบการสืบค้นของคุณและพบว่าแอปพลิเคชันของคุณยุ่งที่สุดในช่วงเวลา 15 นาทีแรกของแต่ละชั่วโมง ซึ่งคุณรองรับการค้นหาพร้อมกันสูงสุด 20 รายการและการสืบค้นแต่ละครั้งต้องใช้ DPU สูงสุด 8 รายการ คุณสร้างการสำรองปริมาณการประมวลผลด้วย 160 DPU (20 การสืบค้น × 8 DPU ต่อการสืบค้น) เพื่อจัดการกับภาวะพร้อมกันสูงสุดของคุณ
- ค่าบริการในการรองรับเวิร์กโหลดสูงสุดของคุณด้วยการสำรองปริมาณการประมวลผลจะคำนวณเป็น: 160 DPU × 0.30 USD ต่อชั่วโมง DPU × 0.25 ชั่วโมง = 12.00 USD
ในช่วง 45 นาทีในแต่ละชั่วโมงเมื่อปริมาณการสืบค้นลดลง คุณจะลดปริมาณการประมวลผลเป็น 16 DPU เพื่อรับการสืบค้นสูงสุดครั้งละ 4 รายการ
- ค่าบริการในการรองรับเวิร์กโหลดสูงสุดของคุณด้วยการสำรองปริมาณการประมวลผลในช่วงนอกเวลาสูงสุดคือ: 16 DPU × 0.30 USD ต่อชั่วโมง DPU × 0.75 ชั่วโมง = 3.60 USD
- ค่าบริการทั้งหมดในการรองรับเวิร์กโหลดของคุณเป็นเวลาหนึ่งชั่วโมงคือ: 12.00 USD + 3.60 USD = 15.60 USD
ตัวอย่างที่ 3 – แอปพลิเคชัน Apache Spark
ลองพิจารณาใช้โน้ตบุ๊คในคอนโซล Athena เพื่อดึงตัวเลขยอดขายสำหรับไตรมาสก่อนหน้า และสร้างกราฟเพื่อสร้างรายงาน คุณเริ่มเซสชันโดยการใช้โน้ตบุ๊ค เซสชันของคุณใช้เวลา 1 ชั่วโมง และส่งการคำนวณ 6 รายการเป็นส่วนหนึ่งของเซสชัน การคำนวณแต่ละครั้งจะใช้ Worker Node 1-DPU 20 โหนดในการรันและจะใช้เวลา 1 นาที
- DPU ต่อชั่วโมงของตัวปฏิบัติงาน (Worker) = จำนวนการคำนวณ * DPU ที่ใช้ต่อการคำนวณ * เวลาดำเนินการคำนวณ = การคำนวณ 6 รายการ * 20 DPU ต่อการคำนวณ * (1/60) ชั่วโมงต่อการคำนวณ = 2.0 DPU ต่อชั่วโมง
- DPU ต่อชั่วโมงของไดรเวอร์ = DPU ที่ใช้ต่อเซสชัน * เวลาเซสชัน = 1 DPU ต่อเซสชัน * 1 ชั่วโมงต่อเซสชัน = 1.0 DPU ต่อชั่วโมง
- DPU ต่อชั่วโมงทั้งหมด = DPU ต่อชั่วโมงของตัวปฏิบัติงาน (Worker) + DPU ต่อชั่วโมงของไดรเวอร์ = 2.0 DPU ต่อชั่วโมง + 1.0 DPU ต่อชั่วโมง = 3.0 DPU ต่อชั่วโมง
- ค่าบริการแอปพลิเคชัน Spark = 0.35 USD ต่อชั่วโมง DPU * 3.0 DPU ต่อชั่วโมง = 1.05 USD
หมายเหตุ: S3 จะเรียกเก็บเงินคุณแยกต่างหากสำหรับการจัดเก็บและอ่านข้อมูล รวมถึงผลลัพธ์ของการดำเนินการของคุณ
แหล่งข้อมูลเพิ่มเติมเกี่ยวกับราคา
คำนวณต้นทุนรายเดือนอย่างง่ายกับ AWS
ติดต่อผู้เชี่ยวชาญของ AWS เพื่อรับการเสนอราคาแบบส่วนบุคคล