Cách tạo biểu đồ phân tán trong python

Biểu đồ phân tán là một biểu đồ trong đó các giá trị của hai biến được vẽ dọc theo hai trục. Đây là một loại cốt truyện cơ bản nhất giúp bạn hình dung mối quan hệ giữa hai biến

Ý tưởng

  1. Biểu đồ phân tán là gì?
  2. Biểu đồ phân tán cơ bản trong python
  3. Mối tương quan với biểu đồ phân tán
  4. Thay đổi màu của các nhóm điểm
  5. Thay đổi màu sắc và điểm đánh dấu
  6. Biểu đồ phân tán với biểu đồ khớp tuyến tính bằng cách sử dụng seaborn
  7. Biểu đồ phân tán với biểu đồ sử dụng seaborn
  8. âm mưu bong bóng
  9. Phân tích thăm dò sử dụng Bộ dữ liệu mtcars
    • Nhiều dòng phù hợp nhất
    • Điều chỉnh màu sắc và kiểu dáng cho các danh mục khác nhau
    • Chú thích văn bản trong Scatter Plot
    • Biểu đồ bong bóng với các biến phân loại
    • cốt truyện phân loại

Biểu đồ phân tán là gì?

Biểu đồ phân tán là biểu đồ của hai bộ dữ liệu dọc theo hai trục. Nó được sử dụng để hình dung mối quan hệ giữa hai biến

Nếu giá trị dọc theo trục Y dường như tăng khi trục X tăng [hoặc giảm], điều đó có thể biểu thị mối quan hệ tuyến tính dương [hoặc âm]. Trong khi đó, nếu các điểm được phân phối ngẫu nhiên không có mẫu rõ ràng, thì điều đó có thể cho thấy thiếu mối quan hệ phụ thuộc

Trong python matplotlib, biểu đồ phân tán có thể được tạo bằng cách sử dụng

# Simple Scatterplot with colored points
x = range[50]
y = range[50] + np.random.randint[0,30,50]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.scatter[x, y, c=y, cmap='Spectral']
plt.colorbar[]
plt.title['Simple Scatter plot']
plt.xlabel['X - value']
plt.ylabel['Y - value']
plt.show[]
2 hoặc
# Simple Scatterplot with colored points
x = range[50]
y = range[50] + np.random.randint[0,30,50]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.scatter[x, y, c=y, cmap='Spectral']
plt.colorbar[]
plt.title['Simple Scatter plot']
plt.xlabel['X - value']
plt.ylabel['Y - value']
plt.show[]
3. Sử dụng các chức năng này, bạn có thể thêm nhiều tính năng hơn vào biểu đồ phân tán của mình, chẳng hạn như thay đổi kích thước, màu sắc hoặc hình dạng của các điểm

Vậy sự khác biệt giữa

# Simple Scatterplot with colored points
x = range[50]
y = range[50] + np.random.randint[0,30,50]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.scatter[x, y, c=y, cmap='Spectral']
plt.colorbar[]
plt.title['Simple Scatter plot']
plt.xlabel['X - value']
plt.ylabel['Y - value']
plt.show[]
4 so với
# Simple Scatterplot with colored points
x = range[50]
y = range[50] + np.random.randint[0,30,50]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.scatter[x, y, c=y, cmap='Spectral']
plt.colorbar[]
plt.title['Simple Scatter plot']
plt.xlabel['X - value']
plt.ylabel['Y - value']
plt.show[]
5 là gì?

Sự khác biệt giữa hai chức năng là. với

# Simple Scatterplot with colored points
x = range[50]
y = range[50] + np.random.randint[0,30,50]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.scatter[x, y, c=y, cmap='Spectral']
plt.colorbar[]
plt.title['Simple Scatter plot']
plt.xlabel['X - value']
plt.ylabel['Y - value']
plt.show[]
2, bất kỳ thuộc tính nào bạn áp dụng [màu sắc, hình dạng, kích thước của điểm] sẽ được áp dụng trên tất cả các điểm trong khi ở
# Simple Scatterplot with colored points
x = range[50]
y = range[50] + np.random.randint[0,30,50]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.scatter[x, y, c=y, cmap='Spectral']
plt.colorbar[]
plt.title['Simple Scatter plot']
plt.xlabel['X - value']
plt.ylabel['Y - value']
plt.show[]
3, bạn có nhiều quyền kiểm soát hơn đối với hình thức của từng điểm

Nghĩa là, trong

# Simple Scatterplot with colored points
x = range[50]
y = range[50] + np.random.randint[0,30,50]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.scatter[x, y, c=y, cmap='Spectral']
plt.colorbar[]
plt.title['Simple Scatter plot']
plt.xlabel['X - value']
plt.ylabel['Y - value']
plt.show[]
4, bạn có thể thay đổi màu sắc, hình dạng và kích thước của từng dấu chấm [điểm dữ liệu] dựa trên một biến khác. Hoặc thậm chí cùng một biến [y]. Trong khi đó, với
# Simple Scatterplot with colored points
x = range[50]
y = range[50] + np.random.randint[0,30,50]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.scatter[x, y, c=y, cmap='Spectral']
plt.colorbar[]
plt.title['Simple Scatter plot']
plt.xlabel['X - value']
plt.ylabel['Y - value']
plt.show[]
2, các thuộc tính bạn đặt sẽ được áp dụng cho tất cả các điểm trong biểu đồ

Đầu tiên, tôi sẽ nhập các thư viện mà tôi sẽ sử dụng

________số 8

Hàm

# Scatterplot of non-random vzriables
x=np.arange[1,10,0.2]
y= np.exp[x]
plt.scatter[x,y]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.title['Exponential Relation dataset']
plt.show[]
0 dùng để thay đổi các thông số mặc định của hình vẽ đồ thị

Biểu đồ phân tán cơ bản trong python

Trước tiên, hãy tạo dữ liệu nhân tạo bằng cách sử dụng ________ 91. Bạn cần chỉ định không. điểm bạn yêu cầu làm đối số

Bạn cũng có thể chỉ định giới hạn trên và dưới của biến ngẫu nhiên mà bạn cần

Sau đó sử dụng hàm

# Simple Scatterplot with colored points
x = range[50]
y = range[50] + np.random.randint[0,30,50]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.scatter[x, y, c=y, cmap='Spectral']
plt.colorbar[]
plt.title['Simple Scatter plot']
plt.xlabel['X - value']
plt.ylabel['Y - value']
plt.show[]
4 để vẽ biểu đồ phân tán bằng matplotlib. Bạn cần chỉ định các biến x và y làm đối số

# Scatterplot of non-random vzriables
x=np.arange[1,10,0.2]
y= np.exp[x]
plt.scatter[x,y]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.title['Exponential Relation dataset']
plt.show[]
3 được sử dụng để đặt tiêu đề cho cốt truyện của bạn

# Scatterplot of non-random vzriables
x=np.arange[1,10,0.2]
y= np.exp[x]
plt.scatter[x,y]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.title['Exponential Relation dataset']
plt.show[]
4 được sử dụng để gắn nhãn trục x

# Scatterplot of non-random vzriables
x=np.arange[1,10,0.2]
y= np.exp[x]
plt.scatter[x,y]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.title['Exponential Relation dataset']
plt.show[]
5 được sử dụng để gắn nhãn cho trục y

Nhận khóa học Python hoàn chỉnh miễn phí

Đối mặt với tình huống tương tự như những người khác?

Xây dựng sự nghiệp khoa học dữ liệu của bạn với bằng cấp được ngành công nhận trên toàn cầu. Có được tư duy, sự tự tin và các kỹ năng khiến Nhà khoa học dữ liệu trở nên có giá trị

Nhận khóa học Python miễn phí

Nhận khóa học Python hoàn chỉnh miễn phí

Xây dựng sự nghiệp khoa học dữ liệu của bạn với bằng cấp được ngành công nhận trên toàn cầu. Có được tư duy, sự tự tin và các kỹ năng khiến Nhà khoa học dữ liệu trở nên có giá trị

Nhận khóa học Python miễn phí

# Simple Scatterplot with colored points
x = range[50]
y = range[50] + np.random.randint[0,30,50]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.scatter[x, y, c=y, cmap='Spectral']
plt.colorbar[]
plt.title['Simple Scatter plot']
plt.xlabel['X - value']
plt.ylabel['Y - value']
plt.show[]
5

Bạn có thể thấy rằng có một mối quan hệ tuyến tính tích cực giữa các điểm. Nghĩa là, khi X tăng, Y cũng tăng, vì Y thực ra chỉ là X + số ngẫu nhiên

Nếu bạn muốn màu của các điểm thay đổi tùy thuộc vào giá trị của Y [hoặc một biến khác có cùng kích thước], hãy chỉ định màu mà mỗi dấu chấm sẽ sử dụng bằng cách sử dụng đối số

# Scatterplot of non-random vzriables
x=np.arange[1,10,0.2]
y= np.exp[x]
plt.scatter[x,y]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.title['Exponential Relation dataset']
plt.show[]
6

Bạn cũng có thể cung cấp các biến khác có cùng kích thước với X

# Simple Scatterplot with colored points
x = range[50]
y = range[50] + np.random.randint[0,30,50]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.scatter[x, y, c=y, cmap='Spectral']
plt.colorbar[]
plt.title['Simple Scatter plot']
plt.xlabel['X - value']
plt.ylabel['Y - value']
plt.show[]

Hãy tạo một tập dữ liệu với mối quan hệ tăng theo cấp số nhân và trực quan hóa cốt truyện

# Scatterplot of non-random vzriables
x=np.arange[1,10,0.2]
y= np.exp[x]
plt.scatter[x,y]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.title['Exponential Relation dataset']
plt.show[]

# Scatterplot of non-random vzriables
x=np.arange[1,10,0.2]
y= np.exp[x]
plt.scatter[x,y]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.title['Exponential Relation dataset']
plt.show[]
7 được sử dụng để tạo tập dữ liệu giữa giới hạn dưới và giới hạn trên với bước 'khoảng' không. số điểm

Bây giờ bạn có thể thấy rằng có một mối quan hệ hàm mũ giữa trục x và trục y

Mối tương quan với biểu đồ phân tán

1] Nếu giá trị của y tăng theo giá trị của x, thì chúng ta có thể nói rằng các biến có mối tương quan thuận

2] Nếu giá trị của y giảm theo giá trị của x, thì chúng ta có thể nói rằng các biến có mối tương quan nghịch

3] Nếu giá trị của y thay đổi ngẫu nhiên không phụ thuộc vào x, thì nó được cho là có tương quan bằng không

# Simple Scatterplot with colored points
x = range[50]
y = range[50] + np.random.randint[0,30,50]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.scatter[x, y, c=y, cmap='Spectral']
plt.colorbar[]
plt.title['Simple Scatter plot']
plt.xlabel['X - value']
plt.ylabel['Y - value']
plt.show[]
0

Trong biểu đồ trên, bạn có thể thấy rằng đường màu xanh biểu thị mối tương quan dương, đường màu cam biểu thị mối tương quan âm và các chấm màu xanh lục không biểu thị mối liên hệ nào với các giá trị x [nó thay đổi ngẫu nhiên một cách độc lập]

Thay đổi màu của các nhóm điểm

Sử dụng lệnh

# Scatterplot of non-random vzriables
x=np.arange[1,10,0.2]
y= np.exp[x]
plt.scatter[x,y]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.title['Exponential Relation dataset']
plt.show[]
8 để thay đổi màu biểu thị biểu đồ phân tán

# Simple Scatterplot with colored points
x = range[50]
y = range[50] + np.random.randint[0,30,50]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.scatter[x, y, c=y, cmap='Spectral']
plt.colorbar[]
plt.title['Simple Scatter plot']
plt.xlabel['X - value']
plt.ylabel['Y - value']
plt.show[]
2

Thay đổi màu sắc và điểm đánh dấu

Sử dụng lệnh

# Scatterplot of non-random vzriables
x=np.arange[1,10,0.2]
y= np.exp[x]
plt.scatter[x,y]
plt.rcParams.update[{'figure.figsize':[10,8], 'figure.dpi':100}]
plt.title['Exponential Relation dataset']
plt.show[]
9 để thay đổi loại điểm đánh dấu trong biểu đồ phân tán

[‘. ','o','v','^','>','

Chủ Đề