Analisis Data dalam Eksperimen Fusi Nuklir dan Solusi Platform IODA




Program eksperimen perangkat fusi nuklir bertujuan untuk memahami sifat plasma, yang sering kali memerlukan pemecahan masalah kompleks. Analisis plasma melibatkan tantangan besar, termasuk volume data yang sangat besar, kualitas data, relevansi statistik, pemrosesan gambar, prediksi sistem, desain diagnostik, dan adopsi teknologi baru. Misalnya, ITER diperkirakan akan menghasilkan sekitar 2 PByte data per hari. Data eksperimen umumnya disimpan untuk analisis offline, yang menimbulkan masalah terkait volume data dan kualitas data, seperti kalibrasi yang buruk dan baris kesalahan yang tidak akurat. Selain itu, data sering kali terbatas aksesnya, yang menghambat pemanfaatan data dan hasil penelitian.

Analisis pelepasan biasanya dilakukan dalam dua langkah. Pertama, pemrosesan data otomatis mengurangi data untuk persiapan inspeksi manusia. Kedua, perangkat lunak khusus digunakan untuk membantu ilmuwan mendapatkan hasil. Semua analisis ini disebut Penelitian Data Fusi (FDR). Ilmuwan FDR menghadapi tantangan praktis, seperti akses terbatas ke data eksperimental yang disimpan di fasilitas yang dilindungi firewall, memerlukan izin khusus dan koneksi intranet cepat atau hard disk besar. Selain itu, data harus divalidasi dan diatur dengan benar.

Hasil penelitian yang dihasilkan dari teknik Machine Learning (ML) sering kali hanya tersedia untuk kelompok penelitian yang membuatnya, membatasi akses ke data yang lebih bersih dan terannotasi. Ini membatasi kemampuan ilmuwan FDR untuk mereproduksi hasil penelitian.

Dalam analisis FDR, ilmuwan menggunakan berbagai alat perangkat lunak standar untuk analisis data dan visualisasi, bersama dengan pustaka domain spesifik dan rutinitas eksperimen buatan pengguna. Kesulitan muncul karena kebutuhan untuk menggabungkan berbagai pustaka perangkat lunak yang mungkin tidak selalu memiliki dokumentasi terbaru atau konsisten. Keterbatasan akses ke pipeline pemrosesan data yang dapat digunakan kembali dan model ML yang terlatih menyebabkan waktu yang terbuang untuk pengkodean atau perhitungan ulang.

Selain itu, kebutuhan akan daya komputasi tinggi dapat memerlukan perhitungan paralel atau perangkat keras khusus seperti GPU atau FPGA, yang sering kali memerlukan instalasi perangkat lunak tertentu. Mengakses dan memelihara kerangka kerja ini bisa mahal dan memakan waktu.

Untuk mengatasi tantangan ini, komunitas FDR perlu menyepakati perangkat lunak atau platform umum atau, idealnya, membuat cara terbuka dan terfederasi untuk ilmuwan bekerja di bidang ini. Solusi ini harus menyederhanakan akses ke data terannotasi, model yang terlatih, dan perangkat lunak serta perangkat keras analisis terbaru, sambil memfasilitasi komunikasi, reproduktifitas, dan replikasi hasil.

Platform IODA (Input-Output Data Analysis) adalah solusi berbasis web yang dikembangkan untuk memenuhi kebutuhan ini. IODA menyediakan akses aman ke data jarak jauh, perangkat lunak terverifikasi untuk analisis dan visualisasi, akses ke perangkat keras dan perangkat lunak komputasi tertentu, dan kemampuan untuk menambahkan kode pengguna. Platform ini mendukung pembuatan dan eksekusi grafik terarah untuk analisis data, memungkinkan integrasi dengan berbagai bahasa pemrograman dan perangkat keras khusus, serta memfasilitasi kontribusi anggota komunitas. Meskipun beberapa alat perangkat lunak lain juga mendukung desain alur kerja data, IODA menawarkan kemampuan federasi yang lebih maju. (oleh Owen Cita Karmanto)

Komentar