Chúng ta sẽ cố gắng sử dụng lập trình trong bài học này để giải câu đố Python về ma trận tương quan. Điều này được thể hiện trong đoạn mã dưới đây
import seaborn as sns df = sns.load_dataset['iris'] corr_matrix = df.corr[] corr_matrix.style.background_gradient[cmap='coolwarm'] # 'RdBu_r', 'BrBG_r', & PuOr_r are other good diverging colormaps
Bạn sẽ thấy một số ví dụ về các cách khác nhau để giải quyết vấn đề Ma trận tương quan Python trong bài viết này
# option 1 corr_matrix = df.corr[] corr_matrix.style.background_gradient[cmap='coolwarm'] # option 2 plt.figure[figsize=[10,10]] cor = df.corr[] sns.heatmap[cor, annot=True, cmap=plt.cm.Blues]
import numpy as np import scipy.stats x = np.arange[15, 20] y = np.arange[5, 10] stat, p = scipy.stats.pearsonr[x, y]
Chúng tôi đã chứng minh, với rất nhiều ví dụ minh họa, cách giải quyết vấn đề Python về ma trận tương quan
Ma trận tương quan trong Python là gì?
Ma trận tương quan là một bảng chứa các hệ số tương quan giữa các biến. Mỗi ô trong bảng thể hiện mối tương quan giữa hai biến. Giá trị nằm giữa -1 và 1. 27-Jan-2022
Làm thế nào để bạn vẽ một ma trận tương quan trong Python?
Bạn có thể vẽ biểu đồ tương quan giữa hai cột của khung dữ liệu gấu trúc bằng sns. đoạn mã regplot[x=df['column_1'], y=df['column_2']]. Bạn có thể thấy mối tương quan của hai cột của khung dữ liệu dưới dạng biểu đồ phân tán. 08-09-2021
Có gì trong một ma trận tương quan?
Ma trận tương quan chỉ đơn giản là một bảng hiển thị các hệ số tương quan cho các biến khác nhau. Ma trận mô tả mối tương quan giữa tất cả các cặp giá trị có thể có trong một bảng. Nó là một công cụ mạnh mẽ để tóm tắt một tập dữ liệu lớn và để xác định và trực quan hóa các mẫu trong dữ liệu đã cho. 05-May-2022
Làm cách nào để bạn tìm thấy ma trận tương quan của Dataframe trong Python?
phương thức corr[] được sử dụng để tạo ma trận tương quan. Nó được sử dụng để tìm mối tương quan theo cặp của tất cả các cột trong khung dữ liệu. Mọi giá trị na sẽ tự động bị loại trừ. Đối với bất kỳ cột loại dữ liệu không phải số nào trong khung dữ liệu, nó bị bỏ qua. 08-Oct-2021
Làm thế nào để bạn tạo ra một ma trận tương quan?
Ma trận tương quan được tính như thế nào?
Vertica có một chức năng, tên là CORR_MATRIX [kể từ Vertica 9. 2SP1] để tính ma trận tương quan. Nó lấy một mối quan hệ đầu vào với các cột số và tính toán Hệ số tương quan Pearson giữa mỗi cặp cột đầu vào của nó. 05-09-2019
Làm thế nào để bạn tạo một ma trận tương quan với gấu trúc?
Các bước để tạo Ma trận tương quan bằng Pandas
- Bước 1. Thu thập dữ liệu
- Bước 2. Tạo DataFrame bằng Pandas
- Bước 3. Tạo Ma trận tương quan bằng Pandas
- Bước 4 [tùy chọn]. Nhận biểu diễn trực quan của Ma trận tương quan bằng Seaborn và Matplotlib
Biểu đồ ma trận tương quan là gì?
Một ma trận tương quan là một bảng hiển thị các hệ số tương quan giữa các biến. Mỗi ô trong bảng thể hiện mối tương quan giữa hai biến. Ma trận tương quan được sử dụng để tóm tắt dữ liệu, làm đầu vào cho một phân tích nâng cao hơn và làm chẩn đoán cho các phân tích nâng cao
Ma trận tương quan với bản đồ nhiệt là gì?
Bản đồ nhiệt tương quan là biểu diễn đồ họa của ma trận tương quan biểu thị mối tương quan giữa các biến khác nhau. Giá trị của tương quan có thể lấy bất kỳ giá trị nào từ -1 đến 1. Mối tương quan giữa hai biến ngẫu nhiên hoặc dữ liệu hai biến không nhất thiết bao hàm mối quan hệ nhân quả. 16-Apr-2022
Ví dụ về ma trận tương quan là gì?
Ví dụ về ma trận tương quan Mỗi ô trong bảng hiển thị mối tương quan giữa hai biến cụ thể. Ví dụ: ô được đánh dấu bên dưới cho thấy mối tương quan giữa “số giờ dành cho việc học” và “điểm thi” là 0. 82, điều này cho thấy rằng chúng có mối tương quan tích cực mạnh mẽ. 27-Jan-2020
Một cách để định lượng mối quan hệ giữa hai biến là sử dụng hệ số tương quan Pearson, đây là thước đo mối liên hệ tuyến tính giữa hai biếnNó nhận giá trị từ -1 đến 1 trong đó
- -1 chỉ ra mối tương quan tuyến tính hoàn toàn tiêu cực
- 0 biểu thị không có tương quan tuyến tính
- 1 chỉ ra một mối tương quan tuyến tính hoàn toàn tích cực
Hệ số tương quan càng xa 0 thì mối quan hệ giữa hai biến càng chặt chẽ
Nhưng trong một số trường hợp, chúng tôi muốn hiểu mối tương quan giữa nhiều hơn một cặp biến. Trong những trường hợp này, chúng ta có thể tạo một ma trận tương quan, là một bảng vuông hiển thị các hệ số tương quan giữa một số tổ hợp biến theo cặp.
Hướng dẫn này giải thích cách tạo và giải thích ma trận tương quan trong Python
Cách tạo ma trận tương quan trong Python
Sử dụng các bước sau để tạo ma trận tương quan trong Python
Bước 1. Tạo bộ dữ liệu
import pandas as pd data = {'assists': [4, 5, 5, 6, 7, 8, 8, 10], 'rebounds': [12, 14, 13, 7, 8, 8, 9, 13], 'points': [22, 24, 26, 26, 29, 32, 20, 14] } df = pd.DataFrame[data, columns=['assists','rebounds','points']] df assist rebounds points 0 4 12 22 1 5 14 24 2 5 13 26 3 6 7 26 4 7 8 29 5 8 8 32 6 8 9 20 7 10 13 14
Bước 2. Tạo ma trận tương quan
#create correlation matrix df.corr[] assists rebounds points assists 1.000000 -0.244861 -0.329573 rebounds -0.244861 1.000000 -0.522092 points -0.329573 -0.522092 1.000000 #create same correlation matrix with coefficients rounded to 3 decimals df.corr[].round[3] assists rebounds points assists 1.000 -0.245 -0.330 rebounds -0.245 1.000 -0.522 points -0.330 -0.522 1.000
Bước 3. Giải thích ma trận tương quan
Các hệ số tương quan dọc theo đường chéo của bảng đều bằng 1 vì mỗi biến tương quan tuyệt đối với chính nó
Tất cả các hệ số tương quan khác chỉ ra mối tương quan giữa các tổ hợp biến theo cặp khác nhau. Ví dụ