Thiết kế tính năng là gì?
Các tính năng mô hình là những dữ liệu đầu vào mà các mô hình máy học (ML) sử dụng trong lúc đào tạo và suy luận để đưa ra dự đoán. Độ chính xác của mô hình máy học dựa vào một tập dữ liệu chính xác và sự kết hợp của nhiều tính năng. Ví dụ: trong một ứng dụng ML đề xuất danh sách nhạc, các tính năng có thể bao gồm đánh giá bài hát, bài hát đã nghe trước đó và thời gian nghe nhạc. Việc tạo những tính năng này đòi hỏi nhiều công sức thiết kế. Thiết kế tính năng bao gồm việc trích xuất và chuyển đổi các biến từ dữ liệu thô như bảng giá, mô tả sản phẩm và khối lượng hàng bán để bạn có thể sử dụng các tính năng đào tạo và dự đoán. Các bước cần tiến hành để thiết kế tính năng bao gồm trích xuất và làm sạch dữ liệu, tiếp đến là tạo tính năng và lưu trữ.
Thiết kế tính năng có những thách thức nào?
Thiết kế tính năng là hoạt động khó khăn vì nó bao hàm việc kết hợp giữa phân tích dữ liệu, kiến thức về nghiệp vụ kinh doanh và cả trực giác. Khi tạo tính năng, bạn có thể muốn sử dụng ngay dữ liệu sẵn có nhưng thông thường, bạn nên bắt đầu từ việc cân nhắc xem cần dùng đến dữ liệu gì bằng cách thảo luận với các chuyên gia, tìm kiếm ý tưởng và nghiên cứu qua bên thứ ba. Nếu không thực hiện quá trình này, bạn có thể bỏ sót những biến số dự đoán quan trọng.
Trích xuất dữ liệu
Tạo tính năng
Lưu trữ tính năng
AWS có thể hỗ trợ thiết kế tính năng bằng cách nào?
Với Amazon SageMaker Data Wrangler, bạn có thể sử dụng một giao diện trực quan để đơn giản hóa quy trình thiết kế tính năng. Thông qua công cụ lựa chọn dữ liệu SageMaker Data Wrangler, bạn có thể chọn dữ liệu thô mà bạn muốn dùng từ nhiều nguồn dữ liệu khác nhau rồi nhập dữ liệu chỉ với một cú nhấp. SageMaker Data Wrangler bao gồm hơn 300 phép chuyển đổi dữ liệu tích hợp, vì vậy bạn có thể chuẩn hóa, chuyển đổi và kết hợp các tính năng một cách nhanh chóng mà không cần viết bất cứ đoạn mã nào. Sau khi dữ liệu của bạn đã được chuẩn bị, bạn có thể dựng các luồng công việc ML tự động hóa hoàn toàn với Quy trình của Amazon SageMaker và lưu lại để tái sử dụng trong Cửa hàng tính năng của Amazon SageMaker. Cửa hàng tính năng của SageMaker là một kho chuyên dụng, là nơi bạn có thể lưu trữ và truy cập các tính năng để việc đặt tên, sắp xếp và tái sử dụng chúng giữa các đội ngũ được dễ dàng hơn. Cửa hàng tính năng của SageMaker cung cấp một cửa hàng tính năng hợp nhất trong quá trình đào tạo và suy luận theo thời gian thực mà không cần phải viết thêm mã hay tạo quy trình thủ công để duy trì sự nhất quán cho các tính năng.