Apache HBase nedir?

Apache HBase açık kaynaklı, NoSQL ve dağıtılmış büyük veri deposudur. Petabayt ölçeğindeki verilere rastgele, sıkı bir şekilde tutarlı ve gerçek zamanlı erişim imkanı sağlar. HBase, büyük ve seyrek veri kümelerini işlemek için çok etkilidir.

HBase, Apache Hadoop ve Hadoop ekosistemi ile sorunsuz bir şekilde entegre olur ve Amazon Elastic MapReduce (EMR) dosya sistemi (yani EMRFS) kullanılarak Hadoop Dağıtılmış Dosya Sistemi (HDFS) veya Amazon S3 üzerinde çalışır. HBase, Hadoop için Apache MapReduce çerçevesine doğrudan girdi ve çıktı görevi görür ve HBase tabloları üzerinde SQL benzeri sorguları etkinleştirmek için Apache Phoenix ile çalışır. 

HBase logosu

HBase nasıl çalışır?

HBase; sütun odaklı, ilişkisel olmayan bir veritabanıdır. Bu, verilerin tek tek sütunlarda depolandığı ve benzersiz bir satır anahtarıyla dizine eklendiği anlamına gelir. Bu mimari, tek tek satırların ve sütunların hızlı bir şekilde alınmasına ve bir tablo içindeki tek tek sütunlar üzerinde verimli taramalara olanak tanır. Hem veriler hem de istekler bir HBase kümesindeki tüm sunuculara dağıtılır ve sonuçları milisaniyeler içinde petabaytlarca veri üzerinde sorgulamanıza olanak tanır. HBase'in en etkili kullanımı, HBase API'si aracılığıyla erişilen, ilişkisel olmayan verileri depolamaktır. Apache Phoenix yaygın şekilde HBase üzerinde bir SQL katmanı olarak kullanılır ve HBase'de depolanan verileri eklemek, silmek ve sorgulamak için tanıdık SQL söz dizimini kullanmanıza olanak tanır.

HBase'in avantajları nelerdir?

Ölçeklenebilir

HBase, binlerce sunucuda ölçeklendirmeyi ve petabaytlarca veriye erişimi yönetmek için tasarlanmıştır. Amazon EC2'nin esnekliği ve Amazon S3'ün ölçeklenebilirliği sayesinde HBase, büyük veri kümelerine çevrimiçi erişimin altından kalkabilir.

Hızlı

HBase, uygulamalardan gelen istekleri bir ana sunucular kümesine dağıtarak petabaytlarca veriye düşük gecikmeli rastgele okuma ve yazma erişimi sağlar. Her ana sunucu, HDFS ve S3'teki verilere erişebilir ve milisaniye içinde okuma ve yazma isteklerini sunar.

Hataya toleranslı

HBase, tablolarda depolanan verileri kümedeki birden çok ana sunucuya böler ve tekil ana sunucu arızalarına dayanacak şekilde oluşturulmuştur. Veriler HDFS veya S3'te depolandığından, arızalanan ana sunucu tarafından sunulduktan sonra verileri barındırmak için iyi durumdaki ana sunucular otomatik olarak seçilir ve veriler otomatik olarak çevrimiçi hale getirilir.

Hbase için kullanım örnekleri nelerdir?

FINRA (Finans Endüstrisi Düzenleme Kurumu) Amerika Birleşik Devletleri'ndeki en büyük bağımsız menkul kıymetler düzenleyicisidir ve finansal ticaret uygulamalarını izler ve düzenler. FINRA, ilgili pazar etkinliklerini aramak ve görüntülemek amacıyla etkileşimli bir uygulama için (günde milyarlarca artış gösteren) 3 trilyon kayda rastgele erişim sağlamak üzere Amazon S3'te Apache HBase çalıştırmak için Amazon EMR'yi kullanır. FINRA, depolamalarını ve işlemlerini birbirinden ayırarak verilerinin tek bir kopyasını Amazon S3'te depolayabilir ve kümelerini 3 kat çoğaltma ile HDFS'de depolamak için kümelerini boyutlandırmak yerine, gereken işlem kapasitesine göre boyutlandırabilir. Bu, yıllık %60'ın üzerinde maliyet tasarrufu, kolay işlem ölçeklenebilirliği ve yeni bir EC2 erişilebilirlik alanındaki bir kümenin geri yükleme süresini günlerden 30 dakikadan daha kısa bir süreye indirme anlamına gelir.

İnsanları ve işleri birbirine bağlamada küresel bir lider olan Monster, aşağı yönlü analiz için tıklama akışı ve reklam kampanyası verilerini depolamak üzere Amazon EMR'de Apache HBase kullanıyor. Bu, belirli bir kampanyadaki farklı müşteri segmentlerinin performansını, tek bir gösterimin ayrıntılarıyla izlemelerini sağlar. Monster'ın analiz ekibi, kampanya etkinliğini belirlemek için kullanıcı başına görüntüleme ve tıklama sayısını toplamak üzere satırları kolayca tarayabilir. Ek olarak, Apache HBase'in Apache Hadoop ekosistemiyle sıkı entegrasyonunu kullanırlar. Monster, Apache Hive'ı ayrı bir Amazon EMR kümesinde çalıştırarak HBase tablosunu SQL ile sorgulayabilir. Bu, ek analizler ve Apache HBase'den Amazon Redshift'e veri aktarımı için kullanışlıdır.  

AWS, HBase ve Hadoop'u nasıl destekleyebilir?

Amazon EMR, müşterilerin dinamik olarak ölçeklenebilir EC2 bulut sunucularında büyük miktarda veri işlemesine olanak tanıyan en kolay, en hızlı ve en uygun maliyetli yönetilen Hadoop çerçevesini sağlar. Müşteriler ayrıca EMR'de Apache HBase, Hive, Spark, Presto ve Flink gibi diğer popüler dağıtılmış çerçeveleri de çalıştırabilir. 

Amazon EMR hakkında daha fazla bilgi edinin

Hemen ücretsiz bir AWS hesabı oluşturarak AWS'de Apache Hbase'i kullanmaya başlayın.

AWS'de Sonraki Adımlar

Ücretsiz hesap için kaydolun

AWS Ücretsiz Kullanım için anında erişim elde edin.

Kaydolun 
Konsolda oluşturmaya başlayın

AWS Yönetim Konsolu'nda oluşturmaya başlayın.

Oturum açın