Kapan menggunakan Scatter Plot ?

Kegunaan utama scatter plot adalah untuk mengamati dan menunjukkan hubungan antara dua variabel numerik. Titik-titik dalam sebar plot tidak hanya melaporkan nilai titik data individual, tetapi juga pola ketika data diambil secara keseluruhan.

Identifikasi hubungan korelasional yang umum dengan plot pencar. Dalam kasus ini, kami ingin tahu, jika kami diberi nilai horizontal tertentu, prediksi yang baik untuk nilai vertikal. Anda akan sering melihat variabel pada sumbu horizontal dilambangkan sebagai variabel bebas, dan variabel pada sumbu vertikal adalah variabel terikat. Hubungan antar variabel dapat digambarkan dalam banyak cara: positif atau negatif, kuat atau lemah, linier atau nonlinier.

Capaian Pembelajaran :  Menggunakan diagram pencar untuk menyelediki dan menjelaskan hubungan antara dua variabel numerik

Tujuan Pembelajaran :

1.  Menyajikan diagram pencar dari sepasang data

2.  Menjelaskan hubungan antara dua variabel numerik antara dua variabel

Pengertian Diagram Pencar

Diagram pencar merupakan penyajian data dalam bentuk penyebaran titik-titik pada diagram kartesius yang berguna untuk menunjukkan ada atau tidaknya hubungan/korelasi antara dua variabel kuantitatif yang disebut dengan data bivariat.

Jenis – jenis varibel variabel

1.        Variabel Bebas merupakan variabel yang memberikan pengaruh terhadap variabel lainnya. istilah lain dari variabel bebas yaitu variabel independen/variabel stimulus/ variabel input/variabel predictor/variabel anteseden yang disimbolkan dengan X

2.       Variabel terikat merupakan variabel yang dipengaruhi oleh variabel lainnya tapi tidak dapat mempengaruhi variabel lainnya. Istilah lain dari variabel terikat yaitu variabel dependen/variabel outpot/ variabel respon/variabel criteria/variabel konsekuen yang disimbolkan dengan Y

Menggambar diagram pencar secara manual

1.       Menentukan variabel bebas (X) dan variabel terikat (Y)

2.       Temukanlah nilai tertinggi dan nilai terendah untuk setiap variabel

3.       Membuat diagram kartesius dengan skala yang sama untuk memuat seluruh nilai pada setiap data.

4.       Menggambarkan setiap pasangan titik-titik (X,Y) pada diagram kartesius.

Gambarkan diagram pencar tentang pengaruh jumlah penduduk miskin terhadap jumlah talak dan cerai (pasangan nikah) tahun 2016 di Pulau Sumatera.

Jumlah Penduduk Miskin tahun 2016

Jumlah Talak dan Cerai (Pasangan Nikah) tahun 2016

Variabel bebas (X) :  Jumlah penduduk miskin tahun 2016

Variabel terikat (Y) :  Jumlah talak dan cerai pada pasangan nikah tahun 2016

Nilai minimal (X) =  71071

Nilai maksimal (X) =  1452550

Nilai minimal (Y) =  0

Scatter Plot sering juga disebut dengan bagan sebar atau grafik sebar, adalah penggunaan titik-titik untuk mewakili nilai untuk dua variabel numerik yang berbeda. Posisi setiap titik pada sumbu horizontal dan vertikal menunjukkan nilai untuk titik data individual. Scatter plot digunakan untuk mengamati hubungan antar variabel.

Contoh Scatter Plot di atas menunjukkan diameter dan tinggi untuk sampel pohon fiksi. Setiap titik mewakili satu pohon; posisi horizontal setiap titik menunjukkan diameter pohon (dalam sentimeter) dan posisi vertikal menunjukkan tinggi pohon (dalam meter).

Dari plot, kita dapat melihat korelasi positif yang secara umum erat antara diameter pohon dan tingginya. Kita juga bisa mengamati titik outlier, sebuah pohon yang diameternya jauh lebih besar dari yang lain. Pohon ini tampak cukup pendek untuk ketebalannya, yang mungkin memerlukan penyelidikan lebih lanjut.

Apakah teman teman sudah mengevaluasi kesalahan kita?

Mengevaluasi Kesalahan dalam Trading Halo sobat, kalau kita bicara soal trading, pasti ada momen di mana kita bertanya-tanya, “Apa sih yang salah?” Mungkin pernah merugi besar, atau target untung nggak tercapai, padahal sudah berusaha semaksimal...

Dipublikasikan oleh Farrel Hanif Fathurahman

Plot sebar atau sebar (juga dikenal sebagai sebar, sebar, sebar, sebar, atau sebar) adalah grafik atau diagram matematika yang menggunakan koordinat Kartesius untuk mewakili nilai dua variabel. Semacam data Jika simbol (warna/bentuk/ukuran) ditentukan, variabel lain dapat ditampilkan. Data disajikan sebagai kumpulan titik-titik dengan nilai salah satu variabel menentukan posisi pada sumbu horizontal dan nilai variabel lain menentukan posisi pada sumbu vertikal.

Waktu tunggu antara letusan dan durasi letusan untuk Old Faithful Geyser di Taman Nasional Yellowstone, Wyoming, AS. Bagan ini menunjukkan secara umum ada dua jenis letusan: durasi pendek-tunggu-pendek, dan durasi-tunggu-lama-lama.

Grafik 3D memungkinkan Anda memvisualisasikan banyak data. Plot sebar ini menggunakan variabel skalar untuk sumbu ruang yang berbeda. Variabel-variabel tersebut digabungkan membentuk koordinat dalam ruang, yang ditampilkan dengan mesin terbang dan warna dengan variabel skalar lainnya.

Observasi dapat digunakan ketika suatu variabel kontinu dimanipulasi secara eksperimental, yang satu bergantung pada yang lain, atau dua variabel kontinu bersifat independen. Jika suatu parameter secara sistematis menaikkan atau menurunkan parameter lainnya, maka disebut parameter kontrol atau variabel bebas dan diplot pada sumbu horizontal. Variabel terukur atau variabel terikat biasanya diplot pada sumbu vertikal. Jika tidak ada variabel terikat, maka kedua variabel dapat ditampilkan pada satu sumbu, dan hanya scatter plot yang menunjukkan derajat korelasi (bukan sebab akibat) antar variabel.

Plot sebar dapat menunjukkan berbagai hubungan antar variabel dan lokasi tertentu. Misalnya berat badan dan tinggi badan berada pada sumbu y dan tinggi badan berada pada sumbu x. Korelasinya bisa positif (meningkat), negatif (menurun), atau 0 (tidak ada korelasi). Jika pola titik-titiknya miring dari kiri atas ke kanan atas, menunjukkan adanya hubungan positif antar variabel yang diteliti. Jika pola titik miring dari kiri atas ke kanan bawah, menunjukkan korelasi negatif. Untuk mempelajari hubungan antar variabel, Anda dapat menggambar garis yang paling sesuai (disebut “garis tren”).

Persamaan hubungan antar variabel dapat ditentukan dengan sangat tepat. Untuk regresi linier, metode terbaik disebut regresi linier, yang dijamin menghasilkan solusi yang tepat dalam waktu singkat. Tidak ada metode yang diterima secara universal untuk menghasilkan solusi sambungan air yang benar. Plot sebar sangat berguna ketika Anda ingin melihat perbandingan dua kumpulan data untuk menunjukkan non-korelasi antar variabel. Kemampuan melakukan hal ini dapat ditingkatkan dengan menambahkan garis tipis seperti LOESS. Selain itu, ketika data direpresentasikan sebagai model asosiasi sederhana, hubungan ini dapat dilihat sebagai model bertingkat. Diagram pencar adalah salah satu dari tujuh alat dasar pengendalian kualitas.Bagan sebar dapat dibuat dalam bentuk bagan gelembung, penanda, atau/dan garis.

Misalnya, untuk menunjukkan hubungan antara daya hidup seseorang dan berapa lama mereka dapat bernapas, seorang peneliti memilih sekelompok orang untuk dipelajari dan mengukur daya hidup setiap orang (pertama indeks) dan kapan mereka dapat menahan napas. Mampu menahan nafas Mampu menahan nafas (variabel kedua). Peneliti memplot data dalam diagram sebar, menetapkan "kapasitas paru-paru" pada sumbu horizontal dan "waktu menahan napas" pada sumbu vertikal.

Seseorang memiliki kapasitas 400 cl Menahan napas dalam waktu lama. . . 21,7 detik diwakili oleh satu titik pada diagram sebar di titik (400, 21,7) dalam koordinat Cartesian. Plot sebar untuk semua individu dalam suatu penelitian memungkinkan peneliti membandingkan dua variabel dalam kumpulan data secara visual dan membantu menentukan jenis hubungan yang ada di antara keduanya.

Untuk himpunan data variabel (dimensi) Jarak antara baris dan kolom ke-j merupakan grafik variabel Xi dan Xj. Artinya, setiap baris dan kolom adalah satu dimensi, dan setiap sel mencetak sebar dua dimensi.

Sebar normal memperlihatkan pasangan variabel dan ukuran kategori. Anda dapat menampilkan variabel dua arah menggunakan plot petak, plot varians, atau grafik batang segi. Grafik yang berbeda digunakan untuk variabel kategori dan variabel kuantitatif.

Disadur dari: en.wikipedia.org

Kesimpulan: Materi yang telah dipelajari pada video ini

Diagram Scatter (Diagram Pencar)

Contoh struktur data Scatter Plot

Untuk membuat plot sebar, kita perlu memilih dua kolom dari tabel data, satu untuk setiap dimensi plot. Setiap baris tabel akan menjadi satu titik dalam plot dengan posisi sesuai dengan nilai kolom.

Referensi : https://chartio.com/learn/charts/what-is-a-scatter-plot/

Langkah pertama dalam pengvisuaslisasian data dengan diagram scatter plot adalah mengumpulkan data.Pada studi kasus kali ini data yang akan digunakan berasal dari platform Kaggle. Untuk dapat menggunakannya dapat menggunakan link sebagai berikut :

https://www.kaggle.com/datasets/toramky/automobile-dataset

Setelah data berhasil di download, langkah pertama adalah merapihkan data. Untuk merapihkan data dapat dilakukan dengan cara klik pada kolom pertama->Data->Text To Columns. Pilih delimited untuk memisah-misahkan data dan tentukan Comma sebagai tanda pembatas untuk pemisahan datanya.

Jika sudah akan terlihat lebih rapi dibandingkan sebelumnya.

Membuat Data Visualisasi Diagram Scatterplot pada data Engine-size dan Price

3. Klik kiri pada kolom Price, lalu buka tab Insert dan tambahkan chart dengan jenis scatter. Jika sudah akan tampak seperti gambar di     bawah ini.

4. Edit chart scatter sesuai keinginan dan kebutuhan.

5.Tambahkan chart elements trendline untuk menampilkan trendline pada data yang telah disajikan dalam diagram

6. Untuk menampilkan nilai R-squared dapat mengklik kanan pada trendline -> Format trendline -> Centang bagian “Display R-squared value on chart”. Jika sudah dilakukan tampilan diagram scatternya akan tampak seperti berikut.

7. Menentukan nilai rata-rata pada 2 variabel data yang disajikan yaitu Engine-size dan juga Price. Untuk dapat mendapatkan nilai rata-rata dapat menggunakan rumus yang tersedia di Microsoft Excel yaitu =AVERAGE().

8. Langkah selanjutnya adalah menentukan nilai R. Nilai R dapat ditemukan dari nilai R2 dengan menggunakan fungsi =SQRT() untuk mengembalikan akar kuadrat. Maka hasil akhir yang akan dihasilkan akan membentuk diagram seperti berikut.

Dengan membuat diagram diatas bisa kita dapatkan :

Hasil diatas telah memperlihatkan dimana terdapat hubungan linear antara variable Engine-size dan juga variable Price. Dapat dilihat juga, semakin tinggi nilai dari variable Engine-Size maka semakin tinggi juga Nilai pada Variabel Price. Hubungan kedua variable ini bisa dikatakan memiliki nilai positif dengan memiliki nilai R atau nilai korelasinya yaitu 0,704202

Membuat Data Visualisasi Diagram Scatterplot pada data Highway-mpg dan Price

Langkah yang dilakukan sama seperti mengvisualisasikan data sebelumnya yaitu seperti berikut.

3. Klik kiri pada kolom Price, lalu buka tab  Insert dan tambahkan chart dengan jenis scatter

4. Edit tampilan chart scatter sesuai keinginan dan kebutuhan.

5. Tambahkan chart elements trendline untuk menampilkan trendline pada data yang telah disajikan dalam diagram

6. Untuk mendapatkan nilai r-squared secara otomatis dapat mengklik kanan pada trendline -> Format trendline -> Centang bagian  “Display R-squared value on chart”.

7. Menentukan nilai rata-rata pada 2 variabel data yang disajikan yaitu Engine-size dan juga Price. Untuk dapat mendapatkan nilai rata-rata dapat menggunakan rumus yang tersedia di Microsoft Excel yaitu =AVERAGE().

8. adalah menentukan nilai R. Nilai R dapat ditemukan dari nilai R2 dengan menggunakan fungsi =SQRT() untuk mengembalikan akar  kuadrat. Jika semua langkah telah dilakukan maka akan mendapatkan hasil diagram scatter seperti gambar di bawah ini.

Dengan membuat diagram diatas bisa kita dapatkan :

Dapat disimpulkan, semakin tinggi nilai pada variable Highway-mpg maka akan semakin rendah nilai variable Price, hubungan kedua variable tersebut dapat dikatakan kuat negatif dengan nilai korelasi yaitu 0,686222