อะไรคือความแตกต่างระหว่างแมชชีนเลิร์นนิงแบบมีผู้ดูแลและไม่มีผู้ดูแล
แมชชีนเลิร์นนิง (ML)แบบมีผู้ดูแลและไม่มีผู้ดูแลเป็นอัลกอริทึมสองประเภทของ ML อัลกอริทึม ML จะประมวลผลข้อมูลในอดีตปริมาณมากและระบุรูปแบบข้อมูลผ่านการอนุมาน
อัลกอริทึมการเรียนรู้แบบมีผู้ดูแลจะฝึกฝนกับข้อมูลตัวอย่างที่ระบุทั้งอินพุตและเอาต์พุตของอัลกอริทึม ยกตัวอย่างเช่น ข้อมูลอาจจะเป็นรูปภาพของตัวเลขที่เขียนด้วยลายมือพร้อมคำอธิบายประกอบเพื่อบ่งบอกว่าหมายถึงตัวเลขใด เมื่อได้รับข้อมูลที่มีการระบุประเภทอย่างเพียงพอ ระบบการเรียนรู้แบบมีผู้ดูแลจะจดจำคลัสเตอร์ของพิกเซลและรูปร่างที่เชื่อมโยงกับแต่ละหมายเลขที่เขียนด้วยลายมือได้ในท้ายที่สุด
ในทางตรงกันข้าม อัลกอริทึมการเรียนรู้แบบไม่มีผู้ดูแลจะฝึกฝนกับข้อมูลที่ไม่มีการระบุประเภท ซึ่งจะสแกนผ่านข้อมูลใหม่และสร้างการเชื่อมต่อที่มีความหมายระหว่างอินพุตที่ไม่รู้จักกับเอาต์พุตที่กำหนดไว้ล่วงหน้า ยกตัวอย่างเช่น อัลกอริทึมการเรียนรู้แบบไม่มีผู้ดูแลสามารถจัดกลุ่มบทความข่าวจากเว็บไซต์ข่าวต่างๆ ออกเป็นหมวดหมู่ทั่วไปต่างๆ เช่น กีฬาและอาชญากรรม
เทคนิค: การเรียนรู้แบบมีผู้ดูแลเทียบกับการเรียนรู้แบบไม่มีผู้ดูแล
ในการทำแมชชีนเลิร์นนิง คุณจะสอนให้คอมพิวเตอร์ทำการทำนายหรืออนุมาน ขั้นแรก คุณใช้อัลกอริทึมและข้อมูลตัวอย่างในการฝึกโมเดล จากนั้น คุณรวมโมเดลของคุณเข้ากับแอปพลิเคชันของคุณเพื่อสร้างการอนุมานแบบเรียลไทม์และตามขนาด การเรียนรู้แบบมีผู้ดูแลและไม่มีผู้ดูแลเป็นอัลกอริทึมสองประเภทที่แตกต่างกัน
การเรียนรู้แบบมีผู้สอน
ในการเรียนรู้แบบมีผู้ดูแล คุณจะฝึกโมเดลด้วยชุดข้อมูลอินพุตและชุดข้อมูลเอาต์พุตที่มีป้ายกำกับจับคู่ที่สอดคล้องกัน โดยทั่วไปการติดฉลากจะทำด้วยตนเอง ต่อไปคือเทคนิคแมชชีนเลิร์นนิงแบบมีผู้ดูแลบางประเภท
รีเกรสชันทางโลจิสติก
รีเกรสชันทางโลจิสติกทำนายผลลัพธ์ที่เป็นหมวดหมู่ตามอินพุตตั้งแต่หนึ่งตัวขึ้นไป การจำแนกประเภทแบบไบนารีคือเมื่อผลลัพธ์ที่จัดอยู่ในประเภทใดประเภทหนึ่งจากสองประเภท เช่น ใช่หรือไม่ใช่ และผ่านหรือไม่ผ่าน การจำแนกประเภทหลายชั้นคือเมื่อผลลัพธ์ที่จัดอยู่ในประเภทมากกว่าสองประเภท เช่น แมว สุนัข หรือกระต่าย ตัวอย่างของรีเกรสชันทางโลจิสติกคือการทำนายว่านักเรียนจะผ่านหรือไม่ผ่านหน่วยการเรียนรู้ตามจำนวนการเข้าสู่ระบบบทเรียน
อ่านเกี่ยวกับรีเกรสชันทางโลจิสติก »
รีเกรสชันเชิงเส้น
รีเกรสชันเชิงเส้นหมายถึงโมเดลการเรียนรู้แบบมีผู้ดูแลซึ่งทำนายค่าจากสเกลต่อเนื่องโดยอิงตามอินพุตหนึ่งตัวหรือมากกว่า ตัวอย่างของรีเกรสชันเชิงเส้นคือการทำนายราคาบ้าน คุณสามารถคาดการณ์ราคาบ้านตามสถานที่ตั้ง อายุ และจำนวนห้องได้ หลังจากที่คุณฝึกแบบจำลองในชุดข้อมูลการฝึกอบรมการขายในอดีตด้วยตัวแปรเหล่านั้น
อ่านเกี่ยวกับรีเกรสชันเชิงเส้น »
แผนภาพการตัดสินใจต้นไม้
เทคนิคแมชชีนเลิร์นนิงแบบมีผู้ดูแลของแผนภาพการตัดสินใจต้นไม้ใช้อินพุตที่กำหนดและใช้โครงสร้าง if-else เพื่อทำนายผลลัพธ์ ตัวอย่างของปัญหาแผนภาพการตัดสินใจต้นไม้คือการทำนายการเปลี่ยนใจของลูกค้า ตัวอย่างเช่น หากลูกค้าไม่เยี่ยมชมแอปพลิเคชันหลังจากลงทะเบียน แบบจำลองอาจทำนายการเลิกใช้งาน หรือหากลูกค้าเข้าถึงแอปพลิเคชันบนอุปกรณ์หลายเครื่อง และเวลาเซสชันเฉลี่ยสูงกว่าเกณฑ์ที่กำหนด แบบจำลองอาจคาดการณ์การเก็บรักษา
นิวรัลเน็ตเวิร์ก
โซลูชันนิวรัลเน็ตเวิร์กเทียมเป็นเทคนิคการเรียนรู้แบบมีผู้ดูแลที่ซับซ้อนกว่า ในการสร้างผลลัพธ์ที่กำหนด ต้องใช้อินพุตที่กำหนดและทำการแปลงทางคณิตศาสตร์อย่างน้อยหนึ่งชั้นตามการปรับน้ำหนักข้อมูล ตัวอย่างของเทคนิคนิวรัลเน็ตเวิร์กเทียมคือการทำนายตัวเลขจากภาพที่เขียนด้วยลายมือ
อ่านเกี่ยวกับนิวรัลเน็ตเวิร์ก »
การเรียนรู้แบบไม่มีผู้ดูแล
แมชชีนเลิร์นนิงแบบไม่มีผู้ดูแลคือเมื่อคุณให้ข้อมูลอินพุตอัลกอริทึมโดยไม่มีข้อมูลเอาต์พุตที่มีป้ายกำกับ จากนั้น อัลกอริทึมจะระบุรูปแบบและความสัมพันธ์ในและระหว่างข้อมูลด้วยตัวมันเอง ต่อไปคือเทคนิคการเรียนรู้แบบไม่มีผู้ดูแลบางประเภท
การทำคลัสเตอร์
เทคนิคการจัดกลุ่มการเรียนรู้แบบไม่มีผู้ดูแลจะจัดกลุ่มข้อมูลที่ป้อนเข้าไว้ด้วยกัน ดังนั้นข้อมูลเหล่านั้นอาจถูกจัดหมวดหมู่โดยรวม อัลกอริทึมการจัดกลุ่มมีหลายประเภทขึ้นอยู่กับข้อมูลอินพุต ตัวอย่างของการจัดกลุ่มคือการระบุทราฟฟิกเครือข่ายประเภทต่างๆ เพื่อคาดการณ์เหตุการณ์ด้านความปลอดภัยที่อาจเกิดขึ้น
การเรียนรู้กฎการเชื่อมโยง
เทคนิคการเรียนรู้กฎการเชื่อมโยงเปิดเผยความสัมพันธ์ตามกฎระหว่างอินพุตในชุดข้อมูล ตัวอย่างเช่น อัลกอริธึม Apriori ทำการวิเคราะห์ตะกร้าตลาดเพื่อระบุกฎต่างๆ เช่น กาแฟและนมที่มักซื้อพร้อมกัน
ความหนาแน่นของความน่าจะเป็น
เทคนิคความหนาแน่นของความน่าจะเป็นในการเรียนรู้แบบไม่มีผู้ดูแลทำนายโอกาสหรือความเป็นไปได้ที่ค่าของผลลัพธ์จะอยู่ในช่วงของสิ่งที่ถือว่าปกติสำหรับอินพุต ตัวอย่างเช่น มาตรวัดอุณหภูมิในห้องเซิร์ฟเวอร์โดยทั่วไปจะบันทึกระหว่างช่วงองศาที่กำหนด อย่างไรก็ตาม หากจู่ๆ วัดค่าได้ต่ำโดยอิงจากการกระจายความน่าจะเป็น อาจบ่งชี้ว่าอุปกรณ์ทำงานผิดปกติ
การลดขนาด
การลดขนาดเป็นเทคนิคการเรียนรู้แบบไม่มีผู้ดูแลที่ลดจำนวนคุณสมบัติในชุดข้อมูล มักใช้เพื่อประมวลผลข้อมูลล่วงหน้าสำหรับฟังก์ชันแมชชีนเลิร์นนิงอื่นๆ และลดความซับซ้อนและค่าใช้จ่าย ตัวอย่างเช่น, อาจจะเบลอหรือครอบตัดคุณสมบัติแบ็คกราวด์ในแอปพลิเคชันการจดจำภาพ.
ควรใช้เมื่อใด: การเรียนรู้แบบมีผู้ดูแลเทียบกับแบบไม่มีผู้ดูแล
คุณสามารถใช้เทคนิคการเรียนรู้แบบมีผู้ดูแลเพื่อแก้ปัญหาด้วยผลลัพธ์ที่ทราบและมีข้อมูลที่มีป้ายกำกับ ตัวอย่าง ได้แก่ การจัดประเภทสแปมอีเมล การจดจำรูปภาพ และการคาดคะเนราคาหุ้นตามข้อมูลในอดีตที่ทราบ
คุณสามารถใช้การเรียนรู้แบบไม่มีผู้ดูแลสำหรับสถานการณ์ที่ข้อมูลไม่มีป้ายกำกับและมีวัตถุประสงค์เพื่อค้นหารูปแบบ จัดกลุ่มอินสแตนซ์ที่คล้ายกัน หรือตรวจหาความผิดปกติ นอกจากนี้คุณยังสามารถใช้สำหรับงานสำรวจที่ข้อมูลที่มีป้ายกำกับไม่อยู่ ตัวอย่าง ได้แก่ การจัดระเบียบคลังข้อมูลขนาดใหญ่ การสร้างระบบคำแนะนำ และการจัดกลุ่มลูกค้าตามพฤติกรรมการซื้อ
คุณสามารถใช้ทั้งการเรียนรู้แบบมีผู้ดูแลและการเรียนรู้แบบไม่มีผู้ดูแลร่วมกันได้หรือไม่
การเรียนรู้แบบกึ่งมีผู้ดูแลคือการที่คุณใช้ทั้งเทคนิคการเรียนรู้แบบมีผู้ดูแลและแบบไม่มีผู้ดูแลกับปัญหาทั่วไป เป็นอีกหมวดหมู่หนึ่งของแมชชีนเลิร์นนิงในตัวเอง
คุณสามารถใช้การเรียนรู้แบบกึ่งมีผู้ดูแลเมื่อการรับป้ายกำกับสำหรับชุดข้อมูลทำได้ยาก คุณอาจมีข้อมูลที่มีป้ายกำกับจำนวนน้อยกว่าแต่มีข้อมูลที่ไม่มีป้ายกำกับจำนวนมาก เมื่อเทียบกับการใช้ชุดข้อมูลที่มีป้ายกำกับเพียงอย่างเดียว คุณจะมีความแม่นยำและมีประสิทธิภาพมากขึ้นหากคุณรวมเทคนิคการเรียนรู้แบบมีผู้ดูแลและแบบไม่มีผู้ดูแลเข้าด้วยกัน
ต่อไปนี้คือตัวอย่างบางส่วนของแอปพลิเคชันการเรียนรู้แบบกึ่งมีผู้ดูแล
การระบุการฉ้อโกง
ภายในชุดข้อมูลธุรกรรมขนาดใหญ่ มีข้อมูลบางส่วนที่ระบุว่าผู้เชี่ยวชาญได้ยืนยันธุรกรรมที่เป็นการฉ้อโกง เพื่อให้ได้ผลลัพธ์ที่แม่นยำยิ่งขึ้น โซลูชันแมชชีนเลิร์นนิงจะฝึกข้อมูลที่ไม่มีป้ายกำกับก่อน จากนั้นจึงฝึกด้วยข้อมูลที่มีป้ายกำกับ
การวิเคราะห์ความรู้สึก
เมื่อพิจารณาถึงความกว้างของการโต้ตอบกับลูกค้าแบบข้อความขององค์กร การจัดหมวดหมู่หรือป้ายกำกับความคิดเห็นในทุกช่องทางอาจไม่คุ้มทุน องค์กรสามารถฝึกโมเดลในส่วนของข้อมูลที่ไม่มีป้ายกำกับขนาดใหญ่ก่อน แล้วจึงฝึกตัวอย่างที่มีป้ายกำกับ สิ่งนี้จะช่วยให้องค์กรมีความมั่นใจมากขึ้นในความคิดเห็นของลูกค้าทั่วทั้งธุรกิจ
การจัดประเภทเอกสาร
เมื่อใช้หมวดหมู่กับฐานเอกสารขนาดใหญ่ อาจมีเอกสารมากเกินไปที่จะติดฉลาก ตัวอย่างเช่น สิ่งเหล่านี้อาจเป็นรายงาน การถอดเสียง หรือข้อมูลจำเพาะจำนวนนับไม่ถ้วน การฝึกอบรมเกี่ยวกับข้อมูลที่ไม่มีป้ายกำกับเพื่อเริ่มต้นช่วยระบุเอกสารที่คล้ายกันสำหรับการติดฉลาก
สรุปความแตกต่าง: การเรียนรู้แบบมีผู้ดูแลเทียบกับแบบไม่มีผู้ดูแล
การเรียนรู้แบบมีผู้สอน |
การเรียนรู้แบบไม่มีผู้ฝึกฝน |
|
คืออะไร |
คุณฝึกโมเดลที่มีชุดของข้อมูลอินพุตและชุดที่สอดคล้องกันของข้อมูลการส่งออกที่มีป้ายกำกับจับคู่ |
คุณฝึกแบบจำลองที่จะค้นพบโมเดลที่ซ่อนอยู่ในข้อมูลที่ไม่มีป้ายกำกับ |
เทคนิค |
รีเกรสชันทางโลจิสติก รีเกรสชันเชิงเส้น แผนภาพการตัดสินใจต้นไม้ และนิวรัลเน็ตเวิร์ก |
การคลัสเตอร์ การเรียนรู้กฎการเชื่อมโยง ความหนาแน่นของความน่าจะเป็น และการลดขนาด |
เป้าหมาย |
ทำนายผลลัพธ์ตามอินพุตที่รู้จัก |
ระบุข้อมูลความสัมพันธ์ที่มีค่าระหว่างจุดข้อมูลอินพุต จากนั้นจะสามารถนำไปใช้กับการป้อนข้อมูลใหจากนั้นสามารถนำไปใช้กับข้อมูลใหม่เพื่อดึงข้อมูลเชิงลึกที่คล้ายกันม่ในการวาดข้อมูลเชิงลึกที่คล้ายกัน |
วิธี |
ลดข้อผิดพลาดระหว่างเอาต์พุตที่คาดคะเนกับฉลากจริง |
ค้นหารูปแบบ ความเหมือน หรือความผิดปกติภายในข้อมูล |
AWS สามารถช่วยการเรียนรู้แบบมีผู้ดูแลและแบบไม่มีผู้ดูแลได้อย่างไร
Amazon Web Services (AWS) นำเสนอข้อเสนอที่หลากหลายเพื่อช่วยเหลือคุณด้วยแมชชีนเลิร์นนิง (ML) แบบมีผู้ดูแล แบบไม่มีผู้ดูแลดูแล และแบบกึ่งมีผู้ดูแล คุณสามารถสร้าง เรียกใช้ และผสานโซลูชันทุกขนาด ความซับซ้อน หรือกรณีการใช้งาน
Amazon SageMaker เป็นแพลตฟอร์มที่สมบูรณ์ในการสร้างโซลูชั่น ML ของคุณตั้งแต่เริ่มต้น SageMaker มีชุดโมเดลการเรียนรู้ทั้งแบบมีผู้ดูแลและแบบไม่มีผู้ดูแลที่สร้างไว้ล่วงหน้า ความสามารถในการเก็บและการคำนวณ และสภาพแวดล้อมที่มีการจัดการเต็มรูปแบบ
ตัวอย่างเช่น นี่คือคุณสมบัติของ SageMaker ที่คุณสามารถใช้ในงานของคุณ
- ใช้ Amazon SageMaker Autopilot เพื่อสำรวจโซลูชันต่างๆ โดยอัตโนมัติ และค้นหาโมเดลที่ดีที่สุดสำหรับชุดข้อมูลที่คุณกำหนด
- ใช้ Amazon SageMaker Data Wrangler เพื่อเลือกข้อมูล ทำความเข้าใจข้อมูลเชิงลึก และแปลงข้อมูลเพื่อเตรียมข้อมูลสำหรับ ML
- ใช้ Amazon SageMaker Experiments เพื่อวิเคราะห์และเปรียบเทียบการฝึกซ้ำ ML เพื่อเลือกโมเดลที่มีประสิทธิภาพดีที่สุด
- ใช้ Amazon SageMaker Clarify เพื่อตรวจจับและวัดอคติที่อาจเกิดขึ้น ด้วยวิธีนี้ นักพัฒนา ML สามารถจัดการกับอคติที่อาจเกิดขึ้นและอธิบายการคาดคะเนโมเดลได้
เริ่มต้นใช้งานแมชชีนเลิร์นนิงแบบมีผู้ดูแลและแบบไม่มีผู้ดูแลบน AWS โดยสร้างบัญชีวันนี้
ขั้นตอนถัดไปกับ AWS
เรียนรู้วิธีเริ่มต้นใช้งานแมชชีนเลิร์นนิงบน AWS
เรียนรู้วิธีเริ่มต้นใช้งานแมชชีนเลิร์นนิงแบบไม่มีผู้ดูแลบน AWS