Denetimli ve Denetimsiz Makine Öğrenimi Arasındaki Fark Nedir?
Denetimli ve denetimsiz makine öğrenimi (ML), ML algoritmalarının iki kategorisidir. ML algoritmaları, çıkarım yoluyla veri modellerini tanımlamak için büyük miktarda geçmiş veriyi işler.
Denetimli öğrenme algoritmaları, hem algoritmanın girdisini hem de çıktısını belirten örnek veriler üzerinde eğitilir. Örneğin veriler, hangi sayıları temsil ettiklerini belirtmek için el ile yazılmış sayıların açıklamalı görüntüleri olabilir. Yeterince etiketlenmiş veri verildiğinde denetimli öğrenme sistemi sonunda el ile yazılmış her sayı ile ilişkili piksel ve şekil kümelerini tanıyacaktır.
Buna karşılık denetimsiz öğrenme algoritmaları, etiketlenmemiş veriler kullanılarak eğitilir. Bu algoritmalar yeni verileri tarayarak bilinmeyen girdiler ile önceden belirlenmiş çıktılar arasında anlamlı bağlantılar kurar. Örneğin, denetimsiz öğrenme algoritmaları farklı haber sitelerindeki haber yazılarını spor, suç vb. genel kategoriler altında gruplandırabilir.
Teknikler: Denetimli ve denetimsiz öğrenme
Makine öğreniminde bir bilgisayara tahminlerde veya çıkarımda bulunmayı "öğretirsiniz". İlk olarak, bir modeli eğitmek için bir algoritma ve örnek verileri kullanırsınız. Ardından çıkarımları gerçek zamanlı olarak ve uygun ölçekte oluşturmak için modeli uygulamanıza entegre edersiniz. Denetimli ve denetimsiz öğrenme, iki farklı algoritma kategorisidir.
Gözetimli öğrenme
Denetimli öğrenmede, modeli bir dizi giriş verisi ve karşılık gelen bir eşleştirilmiş etiketli çıktı verisi kümesiyle eğitirsiniz. Etiketleme genellikle manuel yapılır. Daha sonra bazı türlerde denetimli makine öğrenimi teknikleri vardır.
Lojistik regresyon
Lojistik regresyon, bir veya daha fazla girdiye dayalı olarak kategorik bir çıktıyı tahmin eder. İkili sınıflandırma, çıktının evet veya hayır ve geçer veya başarısız gibi iki kategoriden birine uygun olması durumudur. Çoklu sınıflandırma, çıktının kedi, köpek veya tavşan gibi ikiden fazla kategoriye uygun olması durumudur. Lojistik regresyona örnek olarak, bir öğrencinin ders yazılımına giriş yapma sayısına bağlı olarak bir üniteyi geçip geçmeyeceğini tahmin etmek verilebilir.
Lojistik regresyon hakkında bilgi edinin »
Doğrusal regresyon
Doğrusal regresyon, bir veya daha fazla girdiye dayalı olarak kesintisiz bir ölçekten bir değeri tahmin eden denetimli öğrenme modellerini ifade eder. Doğrusal regresyon örneği olarak da bir ev fiyatını tahmin etmek verilebilir. Bu değişkenlerle bir dizi geçmiş satış eğitimi verisi üzerinde bir modeli eğittikten sonra, bir evin fiyatını bulunduğu konuma, evin yaşına ve oda sayısına göre tahmin edebilirsiniz.
Doğrusal regresyon hakkında bilgi edinin »
Karar ağacı
Karar ağacı denetimli makine öğrenimi tekniği, verilen bazı girdileri alır ve bir sonucu tahmin etmek için bir if-else yapısını uygular. Müşteri kaybını tahmin etmek, bir karar ağacı sorununa örnek verilebilir. Örneğin, bir müşteri kaydolduktan sonra bir uygulamayı ziyaret etmezse model, müşteri kaybını tahmin edebilir. Alternatif olarak müşteri uygulamaya birden fazla cihazdan erişiyorsa ve ortalama oturum süresi belirli bir eşiğin üzerindeyse model, müşteri tutma oranını tahmin edebilir.
Sinir ağı
Bir sinir ağı çözümü, daha karmaşık bir denetimli öğrenme tekniğidir. Belirli bir sonucu üretmek için belirli girdileri alır ve veri ağırlıklarının ayarlanmasına göre bir veya daha fazla matematiksel dönüşüm katmanını gerçekleştirir. Bir el yazısı görüntüsünden rakamı tahmin etmek, sinir ağı tekniğine örnek verilebilir.
Sinir ağları hakkında bilgi edinin »
Denetimsiz öğrenme
Denetimsiz makine öğrenimi, herhangi bir etiketlenmiş çıktı verisi olmadan algoritma giriş verilerini verdiğiniz durumu ifade eder. Algoritma daha sonra kendi başına, veriler içindeki ve arasındaki kalıpları ve ilişkileri tanımlar. Daha sonra bazı denetimli öğrenme teknikleri türleri vardır.
Kümeleme
Kümeleme denetimsiz öğrenme tekniği, bir bütün olarak kategorize edilebilmesi için belirli veri girdilerini bir arada gruplandırır. Giriş verilerine bağlı olarak çeşitli kümeleme algoritmaları vardır. Potansiyel güvenlik olaylarını tahmin etmek için farklı ağ trafiği türlerini tanımlamak, kümelemeye örnek verilebilir.
Birliktelik kuralını öğrenme
Birliktelik kuralını öğrenme teknikleri, bir veri kümesindeki girdiler arasındaki kural tabanlı ilişkileri ortaya çıkarır. Örneğin, Apriori algoritması genellikle birlikte satın alınan kahve ve süt gibi kuralları belirlemek için pazar sepeti analizi yapar.
Olasılık yoğunluğu
Denetimsiz öğrenmede olasılık yoğunluğu teknikleri, bir çıktının değerinin bir girdi için normal kabul edilen aralıkta olma olasılığını veya ihtimalini tahmin eder. Örneğin, bir sunucu odasındaki bir sıcaklık göstergesi genellikle belirli bir derece aralığında kayıt yapar. Bununla birlikte, olasılık dağılımına bağlı olarak aniden düşük bir değerde ölçüm yaparsa bu durum ekipman arızasına işaret edebilir.
Boyutsallık azaltma
Boyutsallık azaltma, bir veri kümesindeki özelliklerin sayısını azaltan denetimsiz bir öğrenme tekniğidir. Genellikle diğer makine öğrenimi işlevleri için verileri önceden işlemek ve karmaşıklığı ve iş yüklerini azaltmak için kullanılır. Örneğin, bir görüntü tanıma uygulamasında arka plan özelliklerini bulanıklaştırabilir veya kırpabilir.
Kullanım zamanı: Denetimli ve denetimsiz öğrenme
Sonuçları bilinen ve etiketli verileri mevcut olan sorunları çözmek için denetimli öğrenme tekniklerini kullanabilirsiniz. Spam e-posta sınıflandırması, görüntü tanıma ve bilinen geçmiş verilere göre hisse senedi fiyatı tahminleri örnek olarak verilebilir.
Denetimsiz öğrenmeyi, verilerin etiketlenmemiş olduğu ve amacın kalıpları keşfetmek, benzer örnekleri gruplandırmak veya anormallikleri tespit etmek olduğu senaryolar için kullanabilirsiniz. Ayrıca etiketlenmiş verilerin olmadığı keşif amaçlı görevler için de kullanabilirsiniz. Büyük veri arşivlerini düzenlemek, öneri sistemleri oluşturmak ve müşterileri satın alma davranışlarına göre gruplandırmak örnek olarak verilebilir.
Hem denetimli hem de denetimsiz öğrenmeyi birlikte kullanabilir misiniz?
Hem denetimli hem de denetimsiz öğrenme tekniklerini ortak bir soruna uyguladığınız zaman, yarı denetimli öğrenme gerçekleşir. Bu, kendi içinde başka bir makine öğrenimi kategorisidir.
Bir veri kümesi için etiket elde etmek zor olduğunda yarı denetimli öğrenmeyi uygulayabilirsiniz. Elinizde daha düşük hacimli etiketlenmiş veriler, ancak önemli miktarda etiketlenmemiş veriler bulunabilir. Tek başına etiketlenmiş veri kümesini kullanmakla karşılaştırıldığında denetimli ve denetimsiz öğrenme tekniklerini bir araya getirirseniz daha yüksek doğruluk ve verimlilik elde edersiniz.
Yarı denetimli öğrenme uygulamalarına ilişkin birkaç örnek aşağıda verilmiştir.
Dolandırıcılık tanımlama
Büyük bir işlem verisi kümesinin içinde, uzmanların hileli işlemleri onayladığı etiketlenmiş verilerin bir alt kümesi bulunur. Daha doğru bir sonuç almak için makine öğrenimi çözümü, önce etiketlenmemiş veriler üzerinde ve ardından etiketlenmiş verilerle eğitilir.
Duygu analizi
Bir kuruluşun metin tabanlı müşteri etkileşimlerinin genişliği göz önüne alındığında duyguyu tüm kanallarda kategorize etmek veya etiketlemek maliyet açısından uygun olmayabilir. Bir kuruluş, ilk olarak verilerin daha büyük olan etiketlenmemiş kısmıyla ve ardından etiketlenmiş bir örnek üzerinde eğitilir. Bu da kuruluşun iş genelinde müşteri duyarlılığına daha fazla güven duymasını sağlayacaktır.
Belge sınıflandırma
Kategorileri büyük bir belge tabanına uygularken fiziksel olarak etiketlenecek çok fazla sayıda belge olabilir. Örneğin, bunlar sayısız rapor, transkript veya teknik özellik şartnamesi olabilir. Başlamak için etiketlenmemiş verilerle ilgili eğitim, etiketleme için benzer belgelerin tanımlanmasına yardımcı olur.
Farklılıkların özeti: Denetimli ve denetimsiz öğrenme
Gözetimli öğrenme |
Denetimsiz öğrenme |
|
Bu nedir? |
Modeli bir dizi girdi verisi ve ilgili eşleştirilen etiketlenmiş çıktı veri kümesiyle eğitirsiniz. |
Etiketlenmemiş verilerdeki gizli kalıpları keşfetmek için modeli eğitirsiniz. |
Teknikler |
Lojistik regresyon, doğrusal regresyon, karar ağacı ve sinir ağı. |
Kümeleme, birliktelik kuralı öğrenme, olasılık yoğunluğu ve boyutsallık azaltma. |
Hedef |
Bilinen girdilere dayalı olarak bir çıktı tahmin eder. |
Giriş verisi noktaları arasındaki değerli ilişki bilgilerini belirler. Bu daha sonra benzer öngörüler elde etmek için yeni girdiye uygulanabilir. |
Yaklaşım |
Tahmin edilen çıktılar ve gerçek etiketler arasındaki hatayı en düşük seviyeye indirir. |
Verilerdeki kalıpları, benzerlikleri veya anormallikleri bulur. |
AWS denetimli ve denetimsiz öğrenmeye nasıl yardımcı olabilir?
Amazon Web Services (AWS), denetimli, denetimsiz ve yarı denetimli makine öğrenimi (ML) konusunda size yardımcı olacak çok çeşitli teklifler sunar. Herhangi bir boyut, karmaşıklık veya kullanım örneğinde çözümleri oluşturabilir, çalıştırabilir ve entegre edebilirsiniz.
Amazon SageMaker, makine öğrenimi çözümlerinizi sıfırdan oluşturmak için eksiksiz bir platformdur. SageMaker, önceden oluşturulmuş denetimli ve denetimsiz öğrenme modelleri, depolama ve işlem yeteneklerinden oluşan eksiksiz bir paketin yanı sıra tam olarak yönetilen bir ortama sahiptir.
Örneğin, işinizde kullanabileceğiniz SageMaker özellikleri şunlardır:
- Farklı çözümleri otomatik olarak keşfetmek ve veri kümeniz için en iyi modeli bulmak üzere Amazon SageMaker Otomatik Pilot'u kullanın.
- Verileri seçmek, veri öngörülerini anlamak ve makine öğrenimine yönelik veri hazırlamak üzere verileri dönüştürmek için Amazon SageMaker Data Wrangler'ı kullanın.
- En iyi performansı gösteren modeli seçerken makine öğrenimi eğitim yinelemelerini analiz etmek ve karşılaştırmak için Amazon SageMaker Deneyler'i kullanın.
- Olası sapmaları tespit etmek ve ölçmek için Amazon SageMaker Clarify'ı kullanın. Bu şekilde, makine öğrenimi geliştiricileri potansiyel sapmaları ele alabilir ve model tahminlerini açıklayabilir.
Hemen bir hesap oluşturarak AWS'de denetimli ve denetimsiz makine öğrenimine başlayın.
AWS İçin Sonraki Adımlar
AWS'de Denetimli Makine Öğrenimini kullanmaya nasıl başlayacağınızı öğrenin
AWS'de Denetimsiz Makine Öğrenimini kullanmaya nasıl başlayacağınızı öğrenin