Makine öğrenimi nedir?

Makine öğrenimi, bilgisayar sistemlerinin açık talimatlar yerine düzenlere ve çıkarıma bağlı olarak görevleri gerçekleştirmek için kullanacağı algoritmalar ve istatistiksel modeller geliştirme bilimidir. Bilgisayar sistemleri büyük miktarda geçmiş veriyi işlemek ve veri düzenlerini tanımlamak için makine öğrenimi algoritmalarını kullanır. Böylece belirli bir girdi veri kümesinden, sonuçları daha doğru olarak tahmin edebilirler. Örneğin, veri bilimcileri bir tıbbi uygulamayı milyonlarca tarama görüntüsünü ve bunlara karşılık gelen teşhisleri saklayarak röntgen görüntülerinden kanseri teşhis edecek şekilde eğitebilir.

Makine öğrenimi neden önemlidir?

Makine öğrenimi; büyümeyi destekleyerek, yeni gelir akışlarını açığa çıkararak ve zorlu sorunları çözerek işletmelere yardımcı olur. Veri her ne kadar işle ilgili kararların şekillenmesinde kritik bir rol oynasa da şirketler geleneksel olarak müşteri geri bildirimi, çalışanlar ve finans gibi çeşitli kaynaklardan aldıkları verileri kullanmaktadır. Makine öğrenimi araştırmaları bu süreci otomatik hale getirir ve optimize eder. İşletmeler çok yüksek hacimli verileri yüksek hızlarda analiz eden yazılımlar kullanarak daha hızlı sonuçlar elde edebilir.

Makine öğrenimi kullanım örnekleri ve gerçek dünya örnekleri

Makine öğreniminin bazı ana sektörlerdeki kullanım alanlarına bakalım:

Üretim

Makine öğrenimi, üretim sektöründe tahmine dayalı bakımı, kalite kontrolü ve yenilikçi araştırmaları destekleyebilir. Makine öğrenimi teknolojisi ayrıca şirketlerin varlıklar, tedarik zinciri ve envanter yönetimi dahil olmak üzere lojistik çözümlerini iyileştirmesine yardımcı olur. Örneğin, bir üretim devi olan 3M, zımpara kağıdında yenilik yapmak için makine öğrenimini kullanıyor. Makine öğrenimi algoritmaları, 3M araştırmacılarının zımpara kağıdının şekli, boyutları ve yönünde yapılan küçük değişikliklerin aşındırıcılığı ve dayanıklılığı nasıl iyileştirdiğini analiz etmesine olanak sağlamaktadır. Bu gibi öneriler, üretim sürecinin bilgiye dayalı olarak geliştirilmesine yardımcı olur.

Sağlık hizmetleri ve yaşam bilimleri

Gün geçtikçe sayısı artan giyilebilir sensörler ve cihazlar önemli miktarda sağlık verisini ortaya çıkarmıştır. Makine öğrenimi programları bu bilgileri analiz edip teşhis ve tedavi konusunda doktorlara gerçek zamanlı olarak destek olur. Makine öğrenimi araştırmacıları kanser tümörlerini algılayan ve göz hastalıklarını teşhis eden çözümler geliştirmektedir ve bu gibi çözümler, insan sağlığı sonuçlarında önemli iyileştirmeler sağlamaktadır. Örneğin, Cambia Health Solutions hamile kadınlar için tedaviyi otomatikleştirmek ve özelleştirmek için makine öğrenimini kullanır.

Finansal hizmetler

Finansal makine öğrenimi projeleri, risk analizlerinde ve regülasyonda iyileştirmeler sağlar. Makine öğrenimi teknolojisi, yatırımcıların borsa hareketlerini analiz ederek, serbest yatırım fonlarını değerlendirerek veya finansal portföyleri ayarlayarak yeni fırsatları belirlemesine olanak tanır. Ek olarak, yüksek riskli kredi müşterilerinin belirlenmesine ve dolandırıcılık belirtileri taşıyan işlemlerin tespit edilmesine yardımcı olabilir. Örneğin, kişisel bir finans şirketi olan NerdWallet, kredi kartları, bankacılık ve krediler gibi finansal ürünleri karşılaştırmak için makine öğrenimini kullanır.

Perakende

Perakendede müşteri hizmetlerini, stok yönetimini, yukarıya satış ve çapraz kanallı pazarlama uygulamalarını iyileştirmek için makine öğreniminden faydalanılabilir. Örneğin, Amazon Fulfillment (AFT), yanlış konuma yerleştirilmiş envanterlerin tespit edilmesine yönelik bir makine öğrenimi modelini kullanarak altyapı maliyetlerini yüzde 40 azaltmıştır. Bu model, yılda milyonlarca global sevkiyat işlense de Amazon'un tüm ürünleri müşterilere gönderim için hazır bulunduracağına ve zamanında teslim edeceğine dair sözünü yerine getirmesine yardımcı olmaktadır.

Medya ve eğlence

Eğlence şirketleri kendi hedef kitlelerini daha iyi anlamak ve sürükleyici, kişiselleştirilmiş ve istek üzerine içerik sunmak için makine öğrenimine başvurmaktadır. Makine öğrenimi algoritmaları, fragmanlar ve diğer reklamların tasarlanmasına, tüketicilere kişiselleştirilmiş içerik önerilerinde bulunulmasına ve hatta üretimin hızlandırılmasına yardımcı olacak şekilde dağıtılmaktadır. 

Örneğin, Disney medya kütüphanesini arşivlemek için makine öğrenimini kullanır. Makine öğrenimi araçları, medya içeriklerini otomatik olarak etiketleyerek, açıklamalarla ilişkilendirerek ve tasnif ederek Disney yazarlarının ve animasyoncularının hızlıca Disney karakterlerini aramasına ve tanımasına olanak sağlamaktadır.

Görüntü işleme

Bilgisayarlı görü, görüntüleri doğru ve verimli bir şekilde otomatik olarak tanıyan ve tanımlayan bir teknolojidir. Günümüzde bilgisayar sistemleri akıllı telefonlardan, trafik kameralarından, güvenlik sistemlerinden ve diğer cihazlardan birçok görüntü ve videoya erişebilir. Bilgisayarlı görü uygulamaları, bu verileri nesne tanımlama ve yüz tanımanın yanı sıra sınıflandırma, öneri, izleme ve algılama için doğru bir şekilde işlemek üzere makine öğrenimini kullanır.

Örneğin CampSite yaz kampları için lider bir yazılım platformudur. Kampları, ebeveynlerin çocuklarını kamp deneyimine adapte etmesi için her gün binlerce resim yükler. Kamp yapanların fotoğraflarını bulmak, ebeveynler için zaman alıcı ve sinir bozucu bir iş haline geldi. CampSite, görüntüleri otomatik olarak tanımlamak ve çocuklarının yeni fotoğrafları yüklendiğinde ebeveynleri bilgilendirmek için makine öğrenimini kullanır.

Makine öğrenimi nasıl çalışır?

Makine öğreniminin altında yatan ana fikir, girdi ve çıktı verisi kombinasyonları arasındaki mevcut matematiksel ilişkiye dayalıdır. Makine öğrenimi modeli bu ilişkiyi önceden bilmez fakat yeterli veri kümesi sağlanması halinde tahmin edebilir. Bu durum, her makine öğrenimi algoritmasının değiştirilebilir bir matematik fonksiyonu üzerine kurulduğu anlamına gelir. Altta yatan ilkeyi anlamak için aşağıdaki örneği inceleyelim:

  1. Algoritmaya şu girdi/çıktı (i,o) kombinasyonlarını vererek onu "eğitiriz": (2,10), (5,19) ve (9,31)
  2. Algoritma, girdi ve çıktı arasındaki ilişkinin o=3*i+4 olduğunu hesaplar
  3. Daha sonra 7 sayısını girdi olarak verip çıktıyı tahmin etmesini isteriz. Çıktının 25 olduğunu otomatik olarak belirleyebilir.

Bu, temel bir ilke olsa da makine öğrenimi tüm karmaşık veri noktalarının, yeterli veriye ve bu verileri işlemek için gerekli işleme gücüne sahip oldukları sürece bilgisayar sistemleri tarafından matematiksel olarak birbirine bağlanabileceği ilkesine dayalıdır. Bu nedenle, çıktının doğruluğu sağlanan girdinin büyüklüğü ile doğrudan orantılıdır.

Makine öğrenimi algoritması türleri nelerdir?

Algoritmalar, beklenen çıktı ve girdi türüne bağlı olarak dört ayrı öğrenme tarzı altında gruplandırılabilir.

  1. Denetimli makine öğrenimi
  2. Denetimsiz makine öğrenimi
  3. Yarı denetimli öğrenme
  4. Pekiştirmeli makine öğrenimi

1. Denetimli makine öğrenimi

Veri bilimciler algoritmalara, bağıntıları değerlendirmeleri için etiketlenmiş ve tanımlı veriler sağlar. Örnek verilerde algoritmanın hem girdi hem de çıktısı belirtilir. Örneğin, el yazısı içeren şekillerin görüntülerine açıklamalar eklenerek bu şekillerin hangi rakama karşılık geldiği belirtilir. Bir denetimli öğrenme sistemi, yeterli örnek verilmesi halinde her bir rakamla ilişkili piksel ve şekil kümelerini tanıyabilir. Bunun sonucunda 9 ile 4 veya 6 ile 8 gibi rakamları birbirinden güvenilir bir şekilde ayırt ederek elle yazılmış rakamları tanıyabilir. 

Denetimli öğrenmenin avantajları basitlik ve tasarım kolaylığıdır. Olası bir sınırlı sonuç kümesini tahmin ederken, verileri kategorilere ayırırken veya başka iki makine öğrenimi algoritmasından gelen sonuçları birleştirirken yararlı olur. Ancak, milyonlarca veri kümesinin etiketlenmesi zor olabilir. Şimdi buna daha yakından bakalım:

Veri etiketleme nedir?

Veri etiketleme, girdi verilerini karşılık gelen tanımlı çıktı değerleriyle kategorilendirme sürecidir. Denetimli öğrenme, etiketli eğitim verileri gerektirir. Örneğin, milyonlarca elma ve muz görüntüsünün "elma" veya "muz" sözcüğüyle etiketlenmesi gerekecektir. Bu işlem tamamlandığında makine öğrenimi uygulamaları bir meyve görüntüsü verildiğinde bu eğitim verilerini kullanarak meyvenin adını tahmin edebilir. Ancak, milyonlarca yeni verinin etiketlenmesi zaman alan zorlu bir görevdir. Amazon Mechanical Turk gibi kitle kaynak hizmetleri, denetimli öğrenme algoritmalarının bu sınırlamasının üstesinden bir dereceye kadar gelebilir. Bu hizmetler tüm dünya geneline yayılmış uygun maliyetli büyük bir iş gücü havuzuna erişim sağlayarak veri ediniminin biraz daha kolaylaştırmaktadır.

2. Denetimsiz makine öğrenimi

Denetimsiz öğrenme algoritmaları, etiketsiz veriler kullanılarak eğitilir. Bu algoritmalar yeni verileri tarayarak girdiler ve önceden belirlenmiş çıktılar arasında anlamlı bağlantılar kurmaya çalışır. Düzenleri tespit edebilir ve verileri kategorilendirebilirler. Örneğin, denetimsiz algoritmalar farklı haber sitelerindeki haber yazılarını spor, suç vb. genel kategoriler altında gruplandırabilir. Bir yazıdaki anlamı ve duyguyu anlamak için doğal dil işleme araçlarını kullanırlar. Perakende sektöründe, denetimsiz öğrenme müşterilerin satın alma işlemlerinin düzenlerini tespit edebilir ve "müşteri tereyağ satın alıyorsa büyük olasılıkla ekmek de satın alacaktır" gibi veri analizi sonuçları sağlayabilir.

Denetimsiz öğrenme, düzenlerin tanınmasında, anormalliklerin saptanmasında ve verilerin otomatik olarak kategorilere ayrılmasında yararlı olur. Eğitim verisi, etiketleme gerektirmediği için kurulum süreci kolaydır. Bu algoritmalar ek modelleme için verileri otomatik olarak temizlemek ve işlemek amacıyla da kullanılabilir. Bu yöntemin sınırlaması kesin tahminler sunamamasıdır. Ek olarak, belirli veri sonucu türlerini bağımsız olarak ayıramaz.

3. Yarı denetimli öğrenme

Adından da anlaşılacağı gibi bu yöntemde denetimli ve denetimsiz öğrenme bir arada kullanılır. Teknik, küçük miktarda etiketli veri ve büyük miktarda etiketsiz veri kullanarak sistemlerin eğitilmesine bağlıdır. İlk olarak etiketli veriler kullanılarak makine öğrenimi algoritması kısmen eğitilir. Daha sonra, kısmen eğitilen algoritmanın kendisi etiketsiz verileri etiketler. Bu sürece psödo-etiketleme adı verilir. Model daha sonra açıkça programlanmadan ortaya çıkan veri karışımı üzerinde yeniden eğitilir.

Bu yöntemin avantajı büyük miktarda etiketli veriye ihtiyaç duyulmamasıdır. İnsanlar tarafından okunup etiketlenmesi çok uzun zaman alacak uzun belgeler gibi verilerle çalışılırken yararlı olur.

4. Pekiştirmeli öğrenme

Pekiştirmeli öğrenme, algoritmanın geçmesi gereken farklı adımlara ödüllerin iliştirildiği bir yöntemdir. Dolayısıyla, modelin amacı mümkün olduğunca fazla ödül puanı biriktirerek nihai hedefe ulaşmaktır. Video oyunları dünyası son on yılda pekiştirmeli öğrenmenin en çok uygulandığı alan olmuştur. Gelişmiş pekiştirmeli öğrenme algoritmaları, genellikle insan rakiplerini farklı şekilde yenerek klasik ve modern oyunlarda etkileyici sonuçlar elde etmiştir. 

Bu yöntem, en iyi performansını belirsiz ve karmaşık veri ortamlarında göstermese de iş bağlamında nadiren uygulamaya konulmaktadır. İyi tanımlanmış görevler için verimli değildir ve geliştirici yanlılığı sonuçları etkileyebilir. Veri bilimci, ödülleri tasarlarken sonuçları etkileyebilir.

Makine öğrenimi modelleri deterministik midir?

Bir sistemin çıktısı tahmin edilebilir nitelikteyse bu sistemin deterministik olduğu kabul edilir. Çoğu yazılım uygulaması kullanıcının eylemine tahmin edilebilir bir şekilde yanıt verir, dolayısıyla "Kullanıcı bunu yaparsa şu olacak" denilebilir. Ancak, makine öğrenimi algoritmaları deneyim ve gözlem yoluyla öğrenir. Bu nedenle, yapıları gereği olasılıkçıdırlar. Yukarıdaki ifade bu durumda şu şekilde değişir: "Kullanıcı bunu yaparsa %X olasılıkla şu meydana gelecektir."

Makine öğreniminde, determinizm yukarıda açıklanan öğrenme yöntemleri uygulanırken izlenen bir stratejidir. Denetimli, denetimsiz ve diğer eğitim yöntemlerinden herhangi biri, işletmenin arzu ettiği sonuçlara bağlı olarak deterministik yapılabilir. Araştırma sorusu, veri alımı, yapı ve depolama kararları bir deterministik stratejinin mi yoksa deterministik olmayan bir stratejinin mi izleneceğini belirler.

Deterministik ve olasılıkçı yaklaşım

Deterministik yaklaşım, toplanan verilerin doğruluğuna ve miktarına odaklıdır, dolayısıyla verimlilik belirsizlikten daha önceliklidir. Diğer taraftan, deterministik olmayan (veya olasılıkçı) süreç ise şans faktörünü yönetecek şekilde tasarlanır. Makine öğrenimi algoritmalarına öğrenme ve gözlem sırasında belirsizliği ölçme ve tanımlamada yardımcı olacak yerleşik araçlar entegre edilir.

Derin öğrenme nedir?

Derin öğrenme, insan beyni üzerine modellenmiş bir makine öğrenimi tekniğidir. Derin öğrenme algoritmaları, insan beyni tarafından kullanılana benzer bir mantık yapısıyla verileri analiz eder. Derin öğrenme tekniğinde bilgileri katmanlar halinde işlemek için yapay sinir ağları adı verilen akıllı sistemler kullanılır. Girdi katmanındaki veriler, çıktı katmanına gelmeden önce birden fazla "derin" gizli sinir ağı katmanından geçer. Ek gizli katmanlar, standart makine öğrenimi modellerine kıyasla çok daha yüksek kapasiteli öğrenmeyi destekler.

Yapay sinir ağı nedir?

Derin öğrenme katmanları, insan beynindeki nöronlar gibi çalışan yapay sinir ağı (ANN) düğümleridir. Düğümler bir donanım ve yazılım kombinasyonu şeklinde olabilir. Bir derin öğrenme algoritmasındaki her katman ANN düğümlerinden meydana gelir. Her düğüm veya yapay nöron birbirine bağlıdır, ayrıca ilişkili bir değer sayısına ve eşik sayısına sahiptir. Bir düğüm etkinleştirildiğinde kendi değer sayısını girdi olarak sonraki katman düğümüne gönderir. Düğüm yalnızca çıktısı belirtilen eşik değerinin üzerindeyse etkinleştirilir. Aksi takdirde, veri iletilmez.

Bilgisayarlı görme nedir?

Bilgisayarlı görme, derin öğrenmenin gerçek dünyada kullanılan bir uygulama alanıdır. Tıpkı yapay zeka bilgisayarların düşünmesine olanak sağladığı gibi, bilgisayarlı görme de bilgisayarların görmesine, gözlem yapmasına ve yanıt vermesine olanak sağlar. Otonom otomobiller yol tabelalarını "okumak" için bilgisayarlı görmeden yararlanır. Otomobilin kamerası tabelanın fotoğrafını çeker. Bu fotoğraf otomobilin derin öğrenme algoritmasına gönderilir. İlk gizli katman kenarları tespit eder, sonraki katman renkleri ayırt eder ve üçüncü katman ise tabeladaki yazıların ayrıntılarını tanımlar. Algoritma, örneğin, tabelada DUR yazısının bulunduğunu tahmin eder ve otomobil fren mekanizmasını devreye sokarak yanıt verir.

Makine öğrenimi ve derin öğrenme aynı şey midir?

Derin öğrenme, makine öğreniminin bir alt kümesidir. Derin öğrenme algoritmaları, makine öğrenimi algoritmalarının gelişmiş ve matematiksel olarak karmaşık bir evrimi olarak kabul edilebilir.

Makine öğrenimi ve yapay zeka aynı şey midir?

Kısa cevap hayırdır. Makine öğrenimi ve yapay zeka (AI) terimleri birbiri yerine kullanıyor olsa da ikisi aynı şey değildir. Yapay zeka, makineleri daha insanımsı kılmak için kullanılan farklı strateji ve tekniklere yönelik kapsayıcı bir terimdir. Yapay zeka, Alexa gibi akıllı asistanlardan robot süpürgelere ve otonom otomobillere kadar her şeyi kapsamaktadır. Makine öğrenimi, yapay zekanın birçok dalından biridir. Makine öğrenimi, yapay zeka olsa da tüm yapay zeka etkinlikleri makine öğrenimi olarak tanımlanamaz.

Makine öğrenimi ve veri bilimi aynı şey midir?

Hayır, makine öğrenimi ve veri bilimi aynı şey değildir. Veri bilimi, verilerden anlam ve öngörüler çıkarmak için bilimsel bir yaklaşımın izlendiği bir araştırma alanıdır. Veri bilimciler, veri analizi için çok çeşitli araçlar kullanır ve makine öğrenimi de bu araçlardan biridir. Veri bilimciler, veriyle ilişkili iş modeli, ilgi alanı ve veri toplama gibi büyük resim bileşenlerini anlamaya çalışırken, makine öğrenimi yalnızca ham verilerin ele alındığı bir hesaplama sürecidir.

Makine öğreniminin avantajları ve dezavantajları nelerdir?

Makine öğreniminin yapabildiği ve yapamadığı bazı şeylere göz atalım:

Makine öğrenimi modellerinin avantajları:

  • İnsanların gözden kaçırabileceği veri trendlerini ve düzenlerini tanımlayabilir.
  • Kurulum sonrasında insan müdahalesi olmadan çalışabilir. Örneğin, siber güvenlik yazılımlarında makine öğrenimi, yönetici girdisi olmadan ağ trafiğini sürekli olarak izleyip düzensizlikleri tespit edebilir.
  • Sonuçların doğruluk oranı zamanla artabilir.
  • Dinamik, yüksek hacimli ve karmaşık veri ortamlarında çok çeşitli veri formatlarını işleyebilir.

Makine öğrenimi modellerinin dezavantajları:

  • İlk eğitim maliyetli ve zaman alan bir süreçtir. Yeterli veri bulunmaması halinde uygulanması zor olabilir.
  • Donanımın şirket içinde kurulması durumunda ciddi miktarda bir başlangıç yatırımı gerektiren, yoğun işlem kullanımlı bir süreçtir.
  • Uzman yardımı olmadan sonuçları doğru yorumlamak ve belirsizlikleri ortadan kaldırmak zor olabilir.          

Amazon Machine Learning nasıl yardımcı olabilir?

AWS, makine öğrenimini her geliştiricinin, veri bilimcinin ve işletme kullanıcısının hizmetine sunar. Amazon Machine Learning hizmetleri, iş ihtiyaçlarının karşılanması için yüksek performanslı, uygun maliyetli ve ölçeklenebilir bir altyapı sağlar.

Yeni mi başlıyorsunuz?

AWS DeepRacer, AWS DeepComposer ve AWS DeepLens gibi uygulamalı eğitim cihazlarımızla makine öğrenimi konusunda bilgi edinin.

Mevcut bir veri arşiviniz mi var?

Video, görüntü ve metin desteği sunan yerleşik veri etiketleme iş akışları için Amazon SageMaker Veri Etiketleme'yi kullanın.

Mevcut makine öğrenimi sistemleriniz mi var?

Yanlılığı tespit etmek için Amazon SageMaker Clarify, performansı izlemek ve optimize etmek için Amazon SageMaker Hata Ayıklayıcı'yı kullanın.

Derin öğrenmeyi uygulamak mı istiyorsunuz?

Büyük derin öğrenme modellerini otomatik olarak eğitmek için Amazon SageMaker Dağıtılmış Eğitim'i kullanın. Makine öğrenimi yolculuğunuza hemen başlamak üzere ücretsiz bir hesap için kaydolun!

Makine öğrenimi için sonraki adımlar