Làm thế nào để bạn làm một ma trận tương quan trong python?

Chúng ta sẽ cố gắng sử dụng lập trình trong bài học này để giải câu đố Python về ma trận tương quan. Điều này được thể hiện trong đoạn mã dưới đây

import seaborn as sns
df = sns.load_dataset['iris']
corr_matrix = df.corr[]
corr_matrix.style.background_gradient[cmap='coolwarm']
# 'RdBu_r', 'BrBG_r', & PuOr_r are other good diverging colormaps

Bạn sẽ thấy một số ví dụ về các cách khác nhau để giải quyết vấn đề Ma trận tương quan Python trong bài viết này

# option 1
corr_matrix = df.corr[]
corr_matrix.style.background_gradient[cmap='coolwarm']

# option 2
plt.figure[figsize=[10,10]]
cor = df.corr[]
sns.heatmap[cor, annot=True, cmap=plt.cm.Blues]
import numpy as np
import scipy.stats
x = np.arange[15, 20]
y = np.arange[5, 10]
stat, p = scipy.stats.pearsonr[x, y] 

Chúng tôi đã chứng minh, với rất nhiều ví dụ minh họa, cách giải quyết vấn đề Python về ma trận tương quan

Ma trận tương quan trong Python là gì?

Ma trận tương quan là một bảng chứa các hệ số tương quan giữa các biến. Mỗi ô trong bảng thể hiện mối tương quan giữa hai biến. Giá trị nằm giữa -1 và 1. 27-Jan-2022

Làm thế nào để bạn vẽ một ma trận tương quan trong Python?

Bạn có thể vẽ biểu đồ tương quan giữa hai cột của khung dữ liệu gấu trúc bằng sns. đoạn mã regplot[x=df['column_1'], y=df['column_2']]. Bạn có thể thấy mối tương quan của hai cột của khung dữ liệu dưới dạng biểu đồ phân tán. 08-09-2021

Có gì trong một ma trận tương quan?

Ma trận tương quan chỉ đơn giản là một bảng hiển thị các hệ số tương quan cho các biến khác nhau. Ma trận mô tả mối tương quan giữa tất cả các cặp giá trị có thể có trong một bảng. Nó là một công cụ mạnh mẽ để tóm tắt một tập dữ liệu lớn và để xác định và trực quan hóa các mẫu trong dữ liệu đã cho. 05-May-2022

Làm cách nào để bạn tìm thấy ma trận tương quan của Dataframe trong Python?

phương thức corr[] được sử dụng để tạo ma trận tương quan. Nó được sử dụng để tìm mối tương quan theo cặp của tất cả các cột trong khung dữ liệu. Mọi giá trị na sẽ tự động bị loại trừ. Đối với bất kỳ cột loại dữ liệu không phải số nào trong khung dữ liệu, nó bị bỏ qua. 08-Oct-2021

Làm thế nào để bạn tạo ra một ma trận tương quan?

Ma trận tương quan được tính như thế nào?

Vertica có một chức năng, tên là CORR_MATRIX [kể từ Vertica 9. 2SP1] để tính ma trận tương quan. Nó lấy một mối quan hệ đầu vào với các cột số và tính toán Hệ số tương quan Pearson giữa mỗi cặp cột đầu vào của nó. 05-09-2019

Làm thế nào để bạn tạo một ma trận tương quan với gấu trúc?

Các bước để tạo Ma trận tương quan bằng Pandas

  • Bước 1. Thu thập dữ liệu
  • Bước 2. Tạo DataFrame bằng Pandas
  • Bước 3. Tạo Ma trận tương quan bằng Pandas
  • Bước 4 [tùy chọn]. Nhận biểu diễn trực quan của Ma trận tương quan bằng Seaborn và Matplotlib

Biểu đồ ma trận tương quan là gì?

Một ma trận tương quan là một bảng hiển thị các hệ số tương quan giữa các biến. Mỗi ô trong bảng thể hiện mối tương quan giữa hai biến. Ma trận tương quan được sử dụng để tóm tắt dữ liệu, làm đầu vào cho một phân tích nâng cao hơn và làm chẩn đoán cho các phân tích nâng cao

Ma trận tương quan với bản đồ nhiệt là gì?

Bản đồ nhiệt tương quan là biểu diễn đồ họa của ma trận tương quan biểu thị mối tương quan giữa các biến khác nhau. Giá trị của tương quan có thể lấy bất kỳ giá trị nào từ -1 đến 1. Mối tương quan giữa hai biến ngẫu nhiên hoặc dữ liệu hai biến không nhất thiết bao hàm mối quan hệ nhân quả. 16-Apr-2022

Ví dụ về ma trận tương quan là gì?

Ví dụ về ma trận tương quan Mỗi ô trong bảng hiển thị mối tương quan giữa hai biến cụ thể. Ví dụ: ô được đánh dấu bên dưới cho thấy mối tương quan giữa “số giờ dành cho việc học” và “điểm thi” là 0. 82, điều này cho thấy rằng chúng có mối tương quan tích cực mạnh mẽ. 27-Jan-2020

Một cách để định lượng mối quan hệ giữa hai biến là sử dụng hệ số tương quan Pearson, đây là thước đo mối liên hệ tuyến tính giữa hai biến

Nó nhận giá trị từ -1 đến 1 trong đó

  • -1 chỉ ra mối tương quan tuyến tính hoàn toàn tiêu cực
  • 0 biểu thị không có tương quan tuyến tính
  • 1 chỉ ra một mối tương quan tuyến tính hoàn toàn tích cực

Hệ số tương quan càng xa 0 thì mối quan hệ giữa hai biến càng chặt chẽ

Nhưng trong một số trường hợp, chúng tôi muốn hiểu mối tương quan giữa nhiều hơn một cặp biến. Trong những trường hợp này, chúng ta có thể tạo một ma trận tương quan, là một bảng vuông hiển thị các hệ số tương quan giữa một số tổ hợp biến theo cặp.  

Hướng dẫn này giải thích cách tạo và giải thích ma trận tương quan trong Python

Cách tạo ma trận tương quan trong Python

Sử dụng các bước sau để tạo ma trận tương quan trong Python

Bước 1. Tạo bộ dữ liệu

import pandas as pd

data = {'assists': [4, 5, 5, 6, 7, 8, 8, 10],
        'rebounds': [12, 14, 13, 7, 8, 8, 9, 13],
        'points': [22, 24, 26, 26, 29, 32, 20, 14]
        }

df = pd.DataFrame[data, columns=['assists','rebounds','points']]
df

   assist  rebounds  points
0	4	12	22
1	5	14	24
2	5	13	26
3	6	7	26
4	7	8	29
5	8	8	32
6	8	9	20
7	10	13	14

Bước 2. Tạo ma trận tương quan

#create correlation matrix
df.corr[]

                assists   rebounds     points
assists        1.000000  -0.244861  -0.329573
rebounds      -0.244861   1.000000  -0.522092
points        -0.329573  -0.522092   1.000000

#create same correlation matrix with coefficients rounded to 3 decimals 
df.corr[].round[3]
	       assists	rebounds  points
assists	         1.000	  -0.245  -0.330
rebounds	-0.245	   1.000  -0.522
points	        -0.330	  -0.522   1.000

Bước 3. Giải thích ma trận tương quan

Các hệ số tương quan dọc theo đường chéo của bảng đều bằng 1 vì mỗi biến tương quan tuyệt đối với chính nó

Tất cả các hệ số tương quan khác chỉ ra mối tương quan giữa các tổ hợp biến theo cặp khác nhau. Ví dụ

Chủ Đề