Amazon SageMaker Özellik Deposu

Makine öğrenimi özellikleri için tam olarak yönetilen hizmet

Amazon SageMaker Özellik Mağazasını kullanmaya başlayın

Neden Amazon SageMaker Özellik Deposu tercih edilmelidir?

Amazon SageMaker Özellik Deposu, makine öğrenimi (ML) modelleri için özellik depolamak, paylaşmak ve yönetmek üzere tasarlanmış tam olarak yönetilen bir depodur. Özellikler, eğitim ve çıkarım sırasında kullanılan makine öğrenimi modellerinin girdileridir. Örneğin, müzik çalma listesi öneren bir uygulamada özellikler şarkı derecelendirmelerini, dinleme süresini ve dinleyici demografisini içerebilir. Özellikler birden fazla ekip tarafından tekrar tekrar kullanılır ve özellik kalitesi, son derece doğru bir model sağlamak için kritik öneme sahiptir. Ayrıca, modelleri çevrimdışı olarak toplu halde eğitmek için kullanılan özellikler gerçek zamanlı çıkarım için kullanıma sunulduğunda bu iki özellik deposunu senkronize tutmak zor olabilir. SageMaker Özellik Deposu, makine öğrenimi yaşam döngüsü boyunca özellikleri ölçekli bir şekilde işlemek, standartlaştırmak ve kullanmak için güvenli ve birleşik bir depo sağlar.

Nasıl çalışır?

SageMaker Özellik Deposu'nun Avantajları

Çeşitli veri kaynakları için destek

AWS veya üçüncü taraf veri kaynaklarından uygulama günlükleri, hizmet günlükleri, tıklama akışları, sensörler ve tablo verileri gibi akış ve toplu işler dahil olmak üzere herhangi bir veri kaynağından istediğiniz özelliği alın

Özelliklerin yeniden kullanımını teşvik edin

ML uygulamaları arasında özelliklerin yeniden kullanılmasını teşvik etmek adına eğitim ve çıkarım için ML model özelliklerini depolayın, paylaşın ve yönetin

MLOps uygulamalarını iyileştirin

Verileri ML özelliklerine dönüştürün ve MLOps uygulamalarını destekleyen ve model dağıtım süresini hızlandıran özellik işlem hatları oluşturun

Özellik Yönetimi

Özellik işleme ve alma

Amazon S3, Amazon Redshift, AWS Lake Formation, Snowflake ve Databricks Delta Lake gibi farklı kaynaklardan gelen uygulama ve hizmet günlükleri, tıklama akışları, sensörler ve tablo verileri gibi pek çok veri türünü SageMaker Özellik Deposu'na alabilirsiniz. Özellik işleme kullanarak, toplu veri kaynağınızı ve özellik dönüşüm fonksiyonunu (örneğin ürün görüntülemelerinin sayısı veya zaman penceresi toplamları) belirtebilirsiniz ve SageMaker Özellik Deposu, alım sırasında verileri ML özelliklerine dönüştürür. Amazon SageMaker Data Wrangler ile özellikleri doğrudan SageMaker Özellik Deposu'nda yayımlayabilirsiniz. Apache Spark bağlayıcısı ile yüksek hacimli verileri tek bir kod yardımıyla toplu olarak alabilirsiniz.

Özellik depolama, katalog, arama ve yeniden kullanım

SageMaker Özellik Deposu, Amazon SageMaker Stüdyosu'ndaki görsel arabirimden kolayca bulunabilmesi için özellik gruplarını etiketler ve dizine ekler. Özellik kataloğuna göz atmak, ekiplerin güvenle yeniden kullanabilecekleri mevcut özellikleri keşfetmelerini ve işlem hatlarının tekrarlanmasını önlemelerini sağlar. SageMaker Özellik Deposu, varsayılan olarak AWS Glue Veri Kataloğu'nu kullanır ancak isterseniz farklı bir katalog kullanmanıza izin verir. Ayrıca Amazon Athena veya seçtiğiniz başka bir sorgu aracıyla tanıdık SQL kullanarak özellikleri sorgulayabilirsiniz.

Görüntü, özellik grubu kataloğunu göstermektedir

Özellik tutarlılığı

SageMaker Özellik Mağazası, eğitim için çevrimdışı depolamayı ve gerçek zamanlı çıkarım için çevrimiçi depolamayı destekler. Eğitim ve çıkarım, birbirlerinden çok farklı kullanım alanlarıdır ve her birinin depolama gereksinimleri farklıdır. Eğitim sırasında modeller genellikle tüm veri setini kullanır ve tamamlanması saatler sürebilirken, çıkarımın milisaniyeler içinde gerçekleşmesi gerekir ve genellikle verilerin bir alt kümesini kullanır. SageMaker Özellik Mağazası, birlikte kullanıldığında çevrimdışı ve çevrimiçi veri kümelerinin eşitlenmiş kalmasını sağlar; bu çok önemlidir, çünkü sapma durumunda model doğruluğunu olumsuz etkileyebilir.

Görüntü, özellik grubunun oluşturulmasını göstermektedir

Zaman yolculuğu

Veri bilimcilerin, tanıdan önceki hasta tıbbi verileri gibi o zamanın ötesindeki verileri dahil etme riski olmadan (özellik sızıntısı olarak da adlandırılır) geçmişte belirli bir zamandaki tam özellik değerleri kümesiyle modelleri eğitmesi gerekebilir. SageMaker Özellik Deposu Çevrimdışı API, her bir özelliğin ilgilenilen tarihsel zamandaki durumunu almak için zaman içinde nokta sorgularını destekler.

Görüntü, ilgilenilen tarihsel zamandaki her özelliğin durumunu almak için Özellik Deposu Çevrimdışı API sorgularının akışını göstermektedir

Güvenlik ve Yönetim

Geçmiş takibi

Özelliklerin güvenle yeniden kullanılmasını sağlamak için veri bilimcilerin özelliklerin nasıl oluşturulduğunu, hangi modellerin ve uç noktaların bunları kullandığını bilmesi gerekir. SageMaker Özellik Deposu, veri bilimcilerin Amazon SageMaker Stüdyo'da SageMaker Lineage kullanarak bunların özelliklerini izlemelerine olanak tanır. SageMaker Lineage zamanlanmış işlem hattı yürütme süreçlerini izlemenize, özellikleri veri kaynaklarına kadar takip etmek için yukarı akış silsilesini görselleştirmenize ve özellik işleme kodunu görüntülemenize, hem de bunların tamamını tek bir ortamda yapmanıza olanak tanır.

Görüntü, SageMaker Stüdyosu'ndaki özellik grubunun geçmişini göstermektedir

ML operasyonları

Özellik mağazaları MLOps yaşam döngüsünün önemli bir bileşenidir. Veri kümelerini ve özellik işlem hatlarını yöneterek veri bilimi görevlerini hızlandırıp, aynı özellikleri birden çok kez oluşturmanın getirdiği yinelenen işleri ortadan kaldırır. SageMaker Özellik Mağazası, bağımsız bir hizmet olarak veya diğer SageMaker hizmetleriyle birlikte MLOps yaşam döngüsü boyunca entegre bir şekilde kullanılabilir.

Güvenlik ve uygunluk

Güvenlik ve uygunluk ihtiyaçlarını desteklemek için, paylaşılan makine öğrenimi özelliklerine nasıl erişileceği konusunda ayrıntılı denetime ihtiyacınız olabilir. Bu ihtiyaçlar genellikle tablo ve sütun düzeyinde erişim denetiminin ötesine geçerek tek tek satır düzeyinde erişim denetimine kadar uzanır. Örneğin, hesap temsilcilerinin bir satış tablosundan yalnızca kendi hesaplarına ait satırları görmesine izin vermek ve kredi kartı numaraları gibi hassas verilerin ön ekini maskelemek isteyebilirsiniz. SageMaker Özellik Deposu, AWS Lake Formation ile birlikte özellik deposu verilerini korumak ve role göre erişim vermek adına ayrıntılı erişim denetimleri uygulamak için kullanılabilir.

Görüntü, SageMaker Özellik Deposu ve AWS Lake Formation'ın ayrıntılı erişim denetimlerini uygulamak için nasıl kullanılabileceğini göstermektedir

SageMaker Özellik Deposu için kaynaklar

Blog

Yenilikler

1-5 (11)

Sonuç bulunamadı

1 …

2 3

… 3

Sonraki Adımlar

Guide

Adım adım kılavuzu keşfedin

Daha fazla bilgi edinin

Workshop

Çerez tercihlerinizi seçme