Big Data using Spark Programing

Dear semua, saat ini saya mau berbagi ilmu mengenai big data

History Spark

Spark adalah open source yang telah di buat dan di maintenance oleh suatu komunitas developer
Spark di mulai pada tahun 2009 sebagai reset project UC Berkeley RAD Lab yang kemudian menjadi AMPLab

Reset di lab telah berjalan pada Haddop Map reduce yang efisien untuk perhitungan iretative dan ineterative .

Sejak awal Spark dirancang untuk menjadi cepat pertanyaan interaktif dan algoritma iteratif, membawa ide seperti dukungan untuk penyimpanan di memori dan efisien.

Spark merupakan suatu platform cluster komputer yang di disain untuk proses cepat. Di sisi lain spark merupakan model yang populer untuk MapReduce yang support berbagai macam komputasi.

Spark menawarkan kecepatan dan kemampuan kumputasi di memory, tapi sysytem juga lebih effisien dari pada MapReduce untuk perhitungan komplek.

Kenapa Spark

Spark di disain untuk meng cover jangkauan yang luas.

Why Spark ? vs hadoop :





Comments

Popular Posts