Penjelasan Teknis Facebook, Atas Matinya Layanan Mereka

Penjelasan Teknis Facebook, Atas Matinya Layanan Mereka

NESABAMEDIA.COMFacebook akhirnya mengakui bahwa maintenance kode yang mereka lakukan pada hari Senin (4 Oktober)  itu menjadi biang kerok terjadinya pemadaman sejumlah layanan mereka. Mereka juga menjelaskan, bagaimana infrastruktur mereka bisa lenyap begitu saja dari jaringan internet global. 

Dalam penjelasannya, Facebook mengatakan bahwa mereka sedang melakukan perubahan rute pada Border Gateway Protocol (BGP), yang menuju ke server DNS mereka, sehingga nama domain mengalami kegagalan dan tidak bisa terhubung. 

Hal tersebut berujung pada hilangnya sejumlah situs milik Facebook, aplikasi yang tidak bisa bekerja, dan peralatan serta layanan internal yang dibutuhkan para staff untuk memperbaiki masalah tersebut. 

Facebook juga menjelaskan, bahwa masalah pada BGP dan DNS itu sebenarnya terjadi karena adanya error di bagian lain, yakni dua kelas data center yang dimiliki Facebook. Data center pertama Facebook berfungsi mirip sebuah bangunan raksasa yang menyimpan jutaan mesin, yang bertugas menjalankan komputasi inti dan tugas penyimpanan. Sementara data center yang kedua, seperti fasilitas yang lebih kecil yang menghubungkan jaringan backbone internal Facebook dengan dunia luar. 

Seperti halnya sistem yang kompleks lainnya, backbone itu bukanlah sebuah sistem yang bisa di set-and-forget, dan membutuhkan pemeliharaan rutin. Namun saat melakukan pemeliharaan itu, ada perintah yang salah, yang kemudian justru memutus koneksi antara data center dengan jaringan internet Facebook

“Saat melakukan tugas maintenance rutin itu, sebuah perintah telah diberikan dengan tujuan awalnya untuk mengecek semua kapasitas backbone yang tersedia, namun yang terjadi justru memutus semua koneksi yang ada di jaringan backbone kami,” ungkap Facebook. 

Masalahnya pun menjadi semakin pelik. Data center yang lebih kecil itu diketahui juga mengelola kueri DNS untuk Facebook.com, fb.com, instagram.com dan lainnya. Penerjemahan kueri itu ditangani oleh name server terotorisasi Facebook, yang menempati alamat IP yang dimiliki, yang kemudian bertugas untuk mengelola jaringan internet, lewat BGP. 

Di saat yang bersamaan, server DNS Facebook yang juga sedang bermasalah malah mematikan BGP, ketika mesin-mesin itu tidak mampu lagi mencapai data center cadangan. Ketika perubahan karena perintah yang salah itu mencapai backbone Facebook, dan semua data center terputus, seluruh jaringan Facebook memberikan sinyal bahwa sedang terjadi permasalahan, yang secara otomatis menarik kembali BGP. 

Jadi meskipun server DNS Facebook sudah kembali normal, BGP masih mengalami kekacauan, sehingga Facebook tidak bisa terhubung ke dunia luar. Ditambah lagi, sistem back-end tidak bisa diakses karena matinya backbone tadi. Ini seperti kegagalan ditumpuk dengan kegagalan lainnya.

Leave a Reply

Send this to a friend