Let’s travel together.

Amazon Elastic MapReduce (EMR)

Apa itu Amazon Elastic MapReduce (EMR) ? – Amazon Elastic MapReduce (EMR) adalah alat Amazon Web Services (AWS) untuk pemrosesan dan analisis data besar. Amazon EMR menawarkan layanan konfigurasi rendah yang dapat diperluas sebagai alternatif yang lebih mudah untuk menjalankan komputasi klaster in-house.

Amazon EMR didasarkan pada Apache Hadoop, kerangka pemrograman berbasis Java yang mendukung pemrosesan kumpulan data besar dalam lingkungan komputasi terdistribusi. MapReduce adalah kerangka kerja perangkat lunak yang memungkinkan pengembang untuk menulis program yang memproses sejumlah besar data tidak terstruktur secara paralel di sekelompok prosesor terdistribusi atau komputer yang berdiri sendiri. Ini dikembangkan di Google untuk mengindeks halaman web dan menggantikan algoritma pengindeksan asli dan heuristik mereka pada tahun 2004.

Amazon EMR memproses data besar di seluruh kelompok server virtual Hadoop di Amazon Elastic Compute Cloud (EC2) dan Amazon Simple Storage Service (S3). Elastis dalam nama EMR mengacu pada kemampuan mengubah ukuran dinamis, yang memungkinkannya untuk meningkatkan atau mengurangi penggunaan sumber daya tergantung pada permintaan pada waktu tertentu.
Memproses data besar dengan Amazon EMR

Amazon EMR digunakan untuk analisis data dalam analisis log, pengindeksan web, pergudangan data, pembelajaran mesin, analisis keuangan, simulasi ilmiah, bioinformatika dan banyak lagi. EMR juga mendukung beban kerja berdasarkan Apache Spark, Presto dan Apache HBase – yang terakhir yang terintegrasi dengan Hive dan Babi untuk fungsi tambahan.