Dendrogram nhãn Python

array[[4, 3, 4, 3, 4, 3, 4, 3, 4, 3, 4, 3, 4, 3, 4, 3, 4, 3, 4, 3, 4, 3,
       4, 3, 4, 3, 4, 3, 4, 3, 4, 3, 4, 3, 4, 3, 4, 3, 4, 3, 4, 3, 4, 1,
       4, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 2, 1, 2, 0, 2, 0, 2,
       1, 2, 0, 2, 0, 2, 0, 2, 0, 2, 1, 2, 0, 2, 1, 2, 0, 2, 0, 2, 0, 2,
       0, 2, 0, 2, 0, 2, 1, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2,
       0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2,
       0, 2]]

Chương trình dendro minh họa cách mỗi cụm được cấu tạo bằng cách vẽ một liên kết hình chữ U giữa một cụm không đơn lẻ và các cụm con của nó. Phần trên cùng của liên kết chữ U biểu thị sự hợp nhất cụm. Hai chân của liên kết chữ U cho biết cụm nào đã được hợp nhất. Chiều dài của hai chân U-link thể hiện khoảng cách giữa các cụm con. Nó cũng là khoảng cách cộng hưởng giữa các quan sát ban đầu trong hai cụm con

Thông số . Z ndarray

Ma trận liên kết mã hóa cụm phân cấp để hiển thị dưới dạng dendrogram. Xem hàm

dendrogram[Z, link_color_func=lambda k: colors[k]]
4 để biết thêm thông tin về định dạng của
dendrogram[Z, link_color_func=lambda k: colors[k]]
5

p int, tùy chọn

Tham số

dendrogram[Z, link_color_func=lambda k: colors[k]]
6 cho
dendrogram[Z, link_color_func=lambda k: colors[k]]
7

truncate_mode str, tùy chọn

Chương trình dendro có thể khó đọc khi ma trận quan sát ban đầu mà liên kết được lấy từ đó lớn. Cắt ngắn được sử dụng để cô đặc chương trình dendro. Có một số chế độ

dendrogram[Z, link_color_func=lambda k: colors[k]]
8

Không cắt ngắn được thực hiện [mặc định]. Ghi chú.

dendrogram[Z, link_color_func=lambda k: colors[k]]
0 là bí danh của
dendrogram[Z, link_color_func=lambda k: colors[k]]
8 được giữ để tương thích ngược

dendrogram[Z, link_color_func=lambda k: colors[k]]
2

Các cụm không phải đơn lẻ

dendrogram[Z, link_color_func=lambda k: colors[k]]
6 cuối cùng được hình thành trong liên kết là các nút không phải lá duy nhất trong liên kết; . Tất cả các cụm không đơn lẻ khác được ký hợp đồng thành các nút lá

dendrogram[Z, link_color_func=lambda k: colors[k]]
6

Không có nhiều hơn

dendrogram[Z, link_color_func=lambda k: colors[k]]
6 cấp độ của cây dendrogram được hiển thị. Một “cấp độ” bao gồm tất cả các nút có sự hợp nhất
dendrogram[Z, link_color_func=lambda k: colors[k]]
6 từ lần hợp nhất cuối cùng

Ghi chú.

dendrogram[Z, link_color_func=lambda k: colors[k]]
9 là bí danh của
dendrogram[Z, link_color_func=lambda k: colors[k]]
6 được giữ để tương thích ngược

color_threshold đôi, tùy chọn

Để cho ngắn gọn, hãy để \[t\]

>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
1. Tô màu tất cả các liên kết con bên dưới nút cụm \[k\] cùng màu nếu \[k\] . Tất cả các liên kết kết nối các nút có khoảng cách lớn hơn hoặc bằng ngưỡng được tô màu bằng màu matplotlib mặc định là
>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
2. Nếu
is the first node below the cut threshold \[t\]. All links connecting nodes with distances greater than or equal to the threshold are colored with de default matplotlib color
>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
2. If \[t\] nhỏ hơn hoặc bằng 0, tất cả các nút có màu
>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
2. Nếu
>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
1 là Không có hoặc 'mặc định', tương ứng với hành vi MATLAB[TM], ngưỡng được đặt thành
>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
5.

get_leaves bool, tùy chọn

Bao gồm danh sách

>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
6 trong từ điển kết quả. Đối với mỗi \[i\] ,
>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
7, nút cụm
>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
8 xuất hiện ở vị trí
>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
9 trong đường duyệt từ trái sang phải của các lá, trong đó \[j < 2n-1\] and \[i < n\].

hướng str, tùy chọn

Hướng vẽ biểu đồ dendrogram, có thể là bất kỳ chuỗi nào sau đây

dendrogram[Z, link_color_func=lambda k: colors[k]]
60

Vẽ gốc ở trên cùng và vẽ các liên kết con đi xuống. [mặc định]

dendrogram[Z, link_color_func=lambda k: colors[k]]
61

Vẽ gốc ở dưới cùng và vẽ các liên kết con đi lên

dendrogram[Z, link_color_func=lambda k: colors[k]]
62

Vẽ gốc ở bên trái và vẽ các liên kết con đi bên phải

dendrogram[Z, link_color_func=lambda k: colors[k]]
63

Vẽ gốc ở bên phải và vẽ các liên kết con xuống bên trái

nhãn ndarray, tùy chọn

Theo mặc định,

dendrogram[Z, link_color_func=lambda k: colors[k]]
64 là Không nên chỉ mục của quan sát ban đầu được sử dụng để gắn nhãn cho các nút lá. Mặt khác, đây là một chuỗi có kích thước \[n\] , với
dendrogram[Z, link_color_func=lambda k: colors[k]]
65. Giá trị
dendrogram[Z, link_color_func=lambda k: colors[k]]
66 là văn bản được đặt bên dưới nút lá \[i\] chỉ khi nó tương ứng với một quan sát ban đầu và không phải là một nút đơn .

count_sort str hoặc bool, tùy chọn

Đối với mỗi nút n, thứ tự [trực quan, từ trái sang phải] của hai liên kết con được vẽ trên biểu đồ được xác định bởi tham số này, có thể là bất kỳ giá trị nào sau đây

dendrogram[Z, link_color_func=lambda k: colors[k]]
67

Không có gì được thực hiện

dendrogram[Z, link_color_func=lambda k: colors[k]]
68 hoặc
dendrogram[Z, link_color_func=lambda k: colors[k]]
69

Đứa trẻ có số lượng đối tượng ban đầu tối thiểu trong cụm của nó được vẽ trước

dendrogram[Z, link_color_func=lambda k: colors[k]]
60

Đứa trẻ có số lượng đối tượng ban đầu tối đa trong cụm của nó được vẽ trước

Lưu ý, cả

dendrogram[Z, link_color_func=lambda k: colors[k]]
61 và
dendrogram[Z, link_color_func=lambda k: colors[k]]
62 đều không thể đúng

distance_sort str hoặc bool, tùy chọn

Đối với mỗi nút n, thứ tự [trực quan, từ trái sang phải] của hai liên kết con được vẽ trên biểu đồ được xác định bởi tham số này, có thể là bất kỳ giá trị nào sau đây

dendrogram[Z, link_color_func=lambda k: colors[k]]
67

Không có gì được thực hiện

dendrogram[Z, link_color_func=lambda k: colors[k]]
68 hoặc
dendrogram[Z, link_color_func=lambda k: colors[k]]
69

Đứa trẻ có khoảng cách tối thiểu giữa các hậu duệ trực tiếp của nó được vẽ đầu tiên

dendrogram[Z, link_color_func=lambda k: colors[k]]
60

Đứa trẻ có khoảng cách lớn nhất giữa các hậu duệ trực tiếp của nó được vẽ đầu tiên

Lưu ý

dendrogram[Z, link_color_func=lambda k: colors[k]]
61 và
dendrogram[Z, link_color_func=lambda k: colors[k]]
62 không thể cùng đúng

show_leaf_counts bool, tùy chọn

Khi Đúng, các nút lá đại diện cho \[k>1\] quan sát ban đầu được gắn nhãn với số lượng quan sát mà chúng chứa trong ngoặc đơn.

no_plot bool, tùy chọn

Khi True, kết xuất cuối cùng không được thực hiện. Điều này hữu ích nếu chỉ cần các cấu trúc dữ liệu được tính toán để hiển thị hoặc nếu matplotlib không khả dụng

no_labels bool, tùy chọn

Khi True, không có nhãn nào xuất hiện bên cạnh các nút lá trong kết xuất của dendrogram

leaf_rotation đôi, tùy chọn

Chỉ định góc [tính bằng độ] để xoay nhãn lá. Khi không được chỉ định, vòng quay dựa trên số lượng nút trong chương trình dendrogram [mặc định là 0]

leaf_font_size int, tùy chọn

Chỉ định kích thước phông chữ [theo điểm] của nhãn lá. Khi không được chỉ định, kích thước dựa trên số lượng nút trong chương trình dendro

leaf_label_func lambda hoặc chức năng, tùy chọn

Khi

dendrogram[Z, link_color_func=lambda k: colors[k]]
69 là một hàm có thể gọi được, đối với mỗi lá có chỉ số cụm \[k < 2n-1\] . Dự kiến ​​hàm này sẽ trả về một chuỗi có nhãn cho chiếc lá.

Các chỉ số \[k < n\] tương ứng với các quan sát ban đầu trong khi các chỉ số \[k \ . correspond to non-singleton clusters.

Ví dụ: để gắn nhãn các singleton với id nút của chúng và các non-singleton với id, số lượng và hệ số không nhất quán của chúng, chỉ cần thực hiện

dendrogram[Z, link_color_func=lambda k: colors[k]]
6

show_contracted bool, tùy chọn

Khi True, chiều cao của các nút không phải đơn lẻ được ký hợp đồng thành một nút lá được vẽ dưới dạng các đường chéo dọc theo liên kết kết nối nút lá đó. Điều này thực sự chỉ hữu ích khi cắt ngắn được sử dụng [xem tham số

dendrogram[Z, link_color_func=lambda k: colors[k]]
7]

link_color_func có thể gọi được, tùy chọn

Nếu được cung cấp, link_color_function được gọi với mỗi id không phải là đơn lẻ tương ứng với mỗi liên kết hình chữ U mà nó sẽ vẽ. Chức năng dự kiến ​​​​sẽ trả về màu để vẽ liên kết, được mã hóa dưới dạng mã chuỗi màu matplotlib. Ví dụ

dendrogram[Z, link_color_func=lambda k: colors[k]]

tô màu các liên kết trực tiếp bên dưới mỗi nút không phải đơn lẻ không bị cắt bớt

dendrogram[Z, link_color_func=lambda k: colors[k]]
41 bằng cách sử dụng
dendrogram[Z, link_color_func=lambda k: colors[k]]
42

ax dụ matplotlib Axes, tùy chọn

Nếu Không và no_plot không đúng, dendrogram sẽ được vẽ trên các trục hiện tại. Mặt khác, nếu no_plot không đúng thì dendrogram sẽ được vẽ trên thể hiện

dendrogram[Z, link_color_func=lambda k: colors[k]]
43 đã cho. Điều này có thể hữu ích nếu dendrogram là một phần của hình phức tạp hơn

above_threshold_color str, tùy chọn

Chuỗi màu matplotlib này đặt màu của các liên kết phía trên color_threshold. Mặc định là

>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
2

Trả về . R mệnh lệnh

Từ điển cấu trúc dữ liệu được tính toán để hiển thị chương trình dendrogram. Nó có các phím sau

dendrogram[Z, link_color_func=lambda k: colors[k]]
45

Một danh sách các tên màu. Phần tử thứ k đại diện cho màu của liên kết thứ k

dendrogram[Z, link_color_func=lambda k: colors[k]]
46 và
dendrogram[Z, link_color_func=lambda k: colors[k]]
47

Mỗi người trong số họ là một danh sách các danh sách. Đặt

dendrogram[Z, link_color_func=lambda k: colors[k]]
48 trong đó
dendrogram[Z, link_color_func=lambda k: colors[k]]
49 và
dendrogram[Z, link_color_func=lambda k: colors[k]]
50 trong đó
dendrogram[Z, link_color_func=lambda k: colors[k]]
51, sau đó liên kết thứ k được vẽ là
dendrogram[Z, link_color_func=lambda k: colors[k]]
52 -
dendrogram[Z, link_color_func=lambda k: colors[k]]
53 -
dendrogram[Z, link_color_func=lambda k: colors[k]]
54 -
dendrogram[Z, link_color_func=lambda k: colors[k]]
55

dendrogram[Z, link_color_func=lambda k: colors[k]]
56

Một danh sách các nhãn tương ứng với các nút lá

dendrogram[Z, link_color_func=lambda k: colors[k]]
57

Đối với mỗi i,

>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
7, nút cụm
>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
8 xuất hiện ở vị trí
>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
9 trong đường duyệt từ trái sang phải của các lá, trong đó \[j < 2n-1\]< . Nếu
>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
8 nhỏ hơn
dendrogram[Z, link_color_func=lambda k: colors[k]]
62, nút lá thứ
>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
9 tương ứng với một quan sát ban đầu. Mặt khác, nó tương ứng với một cụm không đơn lẻ.
and \[i < n\]. If
>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
8 is less than
dendrogram[Z, link_color_func=lambda k: colors[k]]
62, the
>>> import numpy as np
>>> from scipy.cluster import hierarchy
>>> import matplotlib.pyplot as plt
9-th leaf node corresponds to an original observation. Otherwise, it corresponds to a non-singleton cluster.

dendrogram[Z, link_color_func=lambda k: colors[k]]
64

Một danh sách các tên màu. Phần tử thứ k đại diện cho màu của lá thứ k

Xem thêm

,

ghi chú

Dự kiến ​​rằng khoảng cách trong

dendrogram[Z, link_color_func=lambda k: colors[k]]
67 là đơn điệu, nếu không thì các giao điểm sẽ xuất hiện trong chương trình dendro

Chủ Đề