Menjawab Petanyaan Seputar Data Analyst

 1. Data adalah?

Data adalah sekumpulan keterangan ataupun fakta yang dibuat dengan kata-kata, kalimat, simbol, angka, dan lainnya. Data disini didapatkan melalui sebuah proses pencarian dan juga pengamatan yang tepat berdasarkan sumber-sumber tertentu. Adapun pengertian lain dari data yaitu sebagai suatu kumpulan keterangan atau deskripsi dasar yang berasal dari obyek ataupun kejadian.



2. Data Analyst adalah?

Data analyst adalah profesi pekerjaan yang tugasnya untuk membaca serta menganalisis data yang ada dari perusahaan dalam rangka keberlangsungan perusahaan tersebut. Di era digitalisasi seperti sekarang profesi terkait pengolahan data sangat menjamur dan dibutuhkan oleh perusahaan-perusahaan. selain data analyst ada juga data engineer, data scientist, dll.


3. Big Data adalah?

Big data adalah konsep yang sangat penting dalam dunia teknologi informasi dan bisnis modern. Dalam penerapannya, big data merujuk kepada volume besar dan kompleks dari beragam jenis data yang dihasilkan dengan cepat dari berbagai sumber. Big data tidak hanya terbatas pada data yang terstruktur, seperti yang disimpan dalam basis data tradisional, tetapi juga mencakup data yang tidak terstruktur, seperti teks, gambar, audio, dan banyak lagi.


4. Pandas DataFrame ?

Pandas DataFrame adalah struktur data dua dimensi yang kuat yang tersedia dalam bahasa pemrograman Python melalui library Pandas. DataFrame memungkinkan untuk menyimpan dan memanipulasi data tabular dengan mudah, seperti spreadsheet.


5. Library Visualisasi Data Pada Bahasa Python?

Matplotlib: Library visualisasi data paling populer dalam Python. Memungkinkan untuk membuat berbagai jenis plot seperti scatter plot, line plot, histogram, dll.

Seaborn: Library yang dibangun di atas Matplotlib, dirancang untuk membuat plot yang lebih indah dan kompleks dengan sintaks yang lebih sederhana.

Plotly: Library interaktif yang memungkinkan pembuatan plot interaktif yang dapat disesuaikan dengan mudah.

Bokeh: Library interaktif lainnya yang fokus pada pembuatan visualisasi data interaktif yang kompleks dan menarik.

ggplot: Port dari library R yang terkenal, ggplot2, ke Python, menyediakan sintaks yang konsisten dan kuat untuk membuat plot yang cantik.


6. Machine Learning?

Machine Learning adalah cabang dari kecerdasan buatan (Artificial Intelligence) yang memungkinkan komputer untuk belajar dari data tanpa perlu secara eksplisit diprogram. Tujuan utama dari Machine Learning adalah membuat model yang dapat digunakan untuk membuat prediksi atau pengambilan keputusan berdasarkan data yang diberikan.


7. Outlier pada data analytic?

Outlier adalah titik data yang secara signifikan berbeda dari titik data lainnya dalam kumpulan data. Outlier dapat menyebabkan kesalahan dalam analisis statistik dan dapat merusak performa model.


8. Model supervised learning?

Model supervised learning adalah jenis model machine learning di mana algoritma belajar dari data yang telah dilabeli. Dalam supervised learning, setiap contoh data memiliki input yang diberi label, yang merupakan output yang diharapkan dari model.


9. Cross Validation Sampling?

Cross Validation adalah teknik evaluasi model machine learning yang digunakan untuk menilai kinerja model pada data yang tidak terlihat selama pelatihan. Teknik ini membagi dataset menjadi beberapa subset atau 'folds'. Pada setiap iterasi, satu fold digunakan untuk pengujian dan sisanya untuk pelatihan. Proses ini diulang hingga setiap fold telah digunakan sebagai set pengujian. Teknik yang umum adalah k-fold cross validation, di mana k adalah jumlah fold yang diinginkan.


10. Hyperparameter Tuning?

Hyperparameter Tuning adalah proses mencari set hyperparameter terbaik untuk model machine learning. Hyperparameter adalah parameter yang ditentukan sebelum proses pelatihan dimulai, seperti learning rate, jumlah hidden layers dalam neural network, atau jumlah trees dalam random forest. Teknik umum untuk tuning hyperparameter termasuk grid search dan random search.


11. Google Colab?

Google Colab (Colaboratory) adalah layanan gratis dari Google Research yang memungkinkan pengguna untuk menulis dan menjalankan kode Python di browser. Colab mendukung Jupyter notebooks dan menyediakan akses ke sumber daya komputasi seperti GPU dan TPU, membuatnya ideal untuk eksperimen machine learning dan analisis data tanpa perlu mengkonfigurasi lingkungan lokal. Colab juga mendukung berbagi dan kolaborasi notebook dengan orang lain.


Sumber Jawaban:

https://www.gramedia.com/literasi/pengertian-data/

https://chatgpt.com/c/0867147e-5bba-407b-8ac0-d345437af2f3

https://www.umn.ac.id/data-analyst-pengertian-tugas-dan-serba-serbinya/

https://www.lspr.ac.id/apa-itu-big-data/

Komentar

Postingan populer dari blog ini

Perbedaan GitHub & GitLab

Apa itu Laravel