Xbar Python

Các thanh được định vị tại x với sự liên kết đã cho. Kích thước của chúng được cho bởi chiều cao và chiều rộng. Đường cơ sở dọc là dưới cùng [mặc định 0]

Nhiều tham số có thể lấy một giá trị duy nhất áp dụng cho tất cả các thanh hoặc một chuỗi giá trị, một giá trị cho mỗi thanh

Thông số . x float hoặc giống như mảng

Tọa độ x của các thanh. Xem thêm căn chỉnh để căn chỉnh các thanh theo tọa độ

chiều cao float hoặc giống như mảng

Chiều cao của các thanh

chiều rộng float hoặc giống như mảng, mặc định. 0. 8

[Các] chiều rộng của các thanh

bottom float hoặc giống như mảng, mặc định. 0

[Các] tọa độ y của [các] mặt dưới của các thanh

căn chỉnh {'trung tâm', 'cạnh'}, mặc định. 'trung tâm'

Căn chỉnh các thanh theo tọa độ x

  • 'trung tâm'. Căn giữa cơ sở trên các vị trí x

  • 'bờ rìa'. Căn chỉnh các cạnh bên trái của các thanh với các vị trí x

Để căn chỉnh các thanh ở cạnh bên phải, vượt qua chiều rộng âm và align='edge'

Trả về .

Vùng chứa có tất cả các thanh và thanh báo lỗi tùy chọn

Thông số khác . màu màu hoặc danh sách màu, tùy chọn

Màu sắc của các mặt thanh

màu cạnh màu hoặc danh sách màu, tùy chọn

Màu sắc của các cạnh thanh

độ rộng dòng float hoặc giống như mảng, tùy chọn

Chiều rộng của [các] cạnh thanh. Nếu 0, không vẽ các cạnh

tick_label str hoặc danh sách str, tùy chọn

Các nhãn đánh dấu của các thanh. Vỡ nợ. Không có [Sử dụng nhãn số mặc định. ]

nhãn str hoặc danh sách str, tùy chọn

Một nhãn duy nhất được gắn vào kết quả dưới dạng nhãn cho toàn bộ tập dữ liệu. Nếu một danh sách được cung cấp, nó phải có cùng độ dài với x và gắn nhãn cho từng thanh riêng lẻ. Các nhãn lặp lại không được loại bỏ trùng lặp và sẽ gây ra các mục nhập nhãn lặp lại, vì vậy cách này được sử dụng tốt nhất khi các thanh cũng khác nhau về kiểu dáng [e. g. , bằng cách chuyển một danh sách sang màu. ]

xerr, yerr float hoặc giống như mảng của hình dạng [N,] hoặc hình dạng [2, N], tùy chọn

Nếu không có, hãy thêm thanh lỗi ngang/dọc vào mẹo thanh. Các giá trị là +/- kích thước so với dữ liệu

  • vô hướng. giá trị +/- đối xứng cho tất cả các thanh

  • hình dạng[N,]. giá trị +/- đối xứng cho mỗi thanh

  • hình dạng[2, N]. Các giá trị - và + riêng biệt cho mỗi thanh. Hàng đầu tiên chứa các lỗi thấp hơn, hàng thứ hai chứa các lỗi cao hơn

  • Không có. Không có thanh lỗi. [Vỡ nợ]

Xem Các cách khác nhau để chỉ định thanh lỗi để biết ví dụ về cách sử dụng xerr và yerr.

ecolor màu hoặc danh sách màu, mặc định. 'màu đen'

Màu đường của thanh lỗi

capsize thả nổi, mặc định. rcParams["errorbar.capsize"] [mặc định. 0.0]

Độ dài của giới hạn thanh lỗi tính bằng điểm

error_kw chính tả, tùy chọn

Từ điển các đối số từ khóa được truyền cho phương thức. Các giá trị của ecolor hoặc capsize được xác định ở đây được ưu tiên hơn các đối số từ khóa độc lập

log bool, mặc định. Sai

Nếu Đúng, hãy đặt trục y thành tỷ lệ log

dữ liệu đối tượng có thể lập chỉ mục, tùy chọn

Nếu được cung cấp, tất cả các tham số cũng chấp nhận một chuỗi s, được hiểu là data[s] [trừ khi điều này dẫn đến một ngoại lệ]

**kwargs của cải

Tài sản

Sự miêu tả

một hàm lọc, lấy một mảng float [m, n, 3] và một giá trị dpi, đồng thời trả về một mảng [m, n, 3] và hai phần bù từ góc dưới cùng bên trái của hình ảnh

Đây là một phần của loạt bài tôi đang viết, đề cập đến các thuật toán ML, được giải thích một cách đơn giản và nhẹ nhàng để dễ hiểu. Tôi chú ý đến các khía cạnh và thuật ngữ kỹ thuật hơn vì mục tiêu ở đây là tạo ra thứ gì đó thúc đẩy việc hiểu các khái niệm theo cách cơ bản nhất, thay vì chỉ làm theo các bước và ném ra các thuật ngữ một cách mù quáng. Tuy nhiên, nếu giải thích của tôi về cơ bản là không chính xác, hãy cho tôi biết

Phần 1 cho Hồi quy tuyến tính đơn giản có thể được tìm thấy ở đây

Bây giờ bạn đã có khái niệm cơ bản về Hồi quy tuyến tính đơn giản từ Phần 1, chúng ta hãy đi vào vấn đề cơ bản

Trong bài đăng này, tôi sẽ đi sâu vào một số cách viết mã Python và toán học đằng sau nó, đồng thời chạm vào một số đặc điểm nhất định của tập dữ liệu

HÃY BẮT ĐẦU NÀO

Thông số/Số liệu thống kê tuyệt vời và nơi tìm thấy chúng

*** CHỈNH SỬA

Tôi muốn giải quyết một số điều khoản trước

Được một người bạn thông báo rằng định nghĩa trước đây của tôi về tham số là không chính xác

Tham số là đặc điểm của một DÂN SỐ [e. g tất cả các kết quả có thể xảy ra]. Rất có thể là không thể lấy được

Thống kê là đặc điểm của MẪU [e. g kết quả chúng ta có thể ghi lại]. Số liệu thống kê cho phép bạn ước tính các thông số. “Số liệu thống kê suy luận cho phép bạn đưa ra dự đoán có cơ sở về tham số dân số”

Ví dụ về các đặc điểm bạn nên làm quen bây giờ

  • Nghĩa là. Trung bình cộng
  • Trung bình. giá trị trung bình
  • phương sai. trung bình của sự khác biệt bình phương giữa mỗi x và Giá trị trung bình x. Nó mô tả mức độ trải rộng của dữ liệu. Nếu phương sai cao, thì 'số thấp' của bạn thấp và 'số cao' của bạn cao, chỉ cần tưởng tượng một dải đàn hồi được giữ ngày càng xa nhau và phương sai tăng dần theo. Phương sai càng thấp thì càng 'ổn định' khi nó hội tụ về Giá trị trung bình
  • Độ lệch chuẩn. Căn bậc hai của phương sai. Về cơ bản, tìm thấy độ rộng của x rộng như thế nào, giống như Phương sai NHƯNG đó là vấn đề về đơn vị. Nếu bạn đang xem tập dữ liệu về chiều cao [tính bằng cm], phương sai sẽ cho bạn cm2, nhưng Độ lệch chuẩn là căn bậc hai của nó và sẽ cho bạn câu trả lời tính bằng cm, và điều này đôi khi tốt hơn để tính toán và ngồi tốt hơn

hai công thức độ lệch chuẩn khác nhau

Trước tiên hãy tìm hiểu về Phương sai và Độ lệch chuẩn, bởi vì bạn sẽ gặp nó RẤT NHIỀU trong mô hình thống kê. Lời giải thích này khá hay…. cộng với có chó con

SIÊU THÔNG SỐ

Cần lưu ý rằng có các tham số được gọi là siêu tham số trong Machine Learning, về cơ bản là các giá trị bạn phải quyết định sử dụng mà không thể “học” được từ thuật toán, nhưng sẽ ảnh hưởng đến mô hình của bạn

Tối ưu hóa/Điều chỉnh siêu tham số là một chủ đề hoàn toàn khác về cách bạn quyết định giá trị của siêu tham số của bạn. Tôi sẽ đề cập đến vấn đề này vào lần tới trong phần giải thích của tôi về phân loại K-Hàng xóm gần nhất. Hoặc bạn có thể đọc về nó ở đây

cảm ơn rất nhiều đến Michael Chia Wei Aun vì đã làm rõ các thông số là gì

Được rồi, Vậy…Regression?

Hãy nhớ rằng trong Phần 1, tôi đã nói về việc cố gắng vẽ các dòng khác nhau để tìm ra dòng có lỗi bình phương nhỏ nhất và cách các gói R và Python có thể giải quyết vấn đề đó cho bạn?

Chà, hãy xem những gói này đang làm gì

GIỮ ĐIỀU NÀY TRONG TÂM TRÍ

y = ax + b

phương trình đường thẳng

Hãy xem phép toán đằng sau việc tìm ra đường thẳng phù hợp nhất

Phương trình đằng sau Phương pháp bình phương nhỏ nhất thông thường trông như thế này

Hình 1. ??????

Không phải phương trình đầu tiên trông quen thuộc sao?

Vì vậy, phương trình thứ 2 và thứ 3 là phương trình bạn cần tìm a và b, về cơ bản đó là những gì chúng tôi đang cố gắng thực hiện ở đây với các gói R và python

a và b được gọi là "beta" trong hồi quy tuyến tính và được coi là tham số đã học vì chúng cuối cùng được "học" sau khi chạy thuật toán hồi quy tuyến tính

Bạn có thể tìm thấy phương trình trên ở đây và toán học đằng sau nó có thể được tìm thấy ở đây

Điều gì đang xảy ra trong các công thức/công thức đó?

Họ đang cố gắng giảm thiểu Tổng bình phương lỗi [Sự khác biệt bình phương giữa thực tế và dự đoán của bạn. Tham khảo phần 1 nếu không chắc chắn, bạn thậm chí có chú ý không?. ]

Để làm điều này đạo hàm riêng của a và b phải bằng 0. Vì 0 là điểm uốn khi đường cong nhỏ nhất. CÓ CÓ

Các công cụ phái sinh không phải để tôi giải thích nhưng bạn có thể thực hiện các sửa đổi nhanh tại đây

X và Y có Mũ trùm đầu ngầu hơn mẹ của bạn

Bạn sẽ nhận thấy rằng phương trình thứ 2 và thứ 3 của Hình 1, x và y có những điều buồn cười trên đầu

x̄ = thanh x

̅y = thanh y

ngoài việc là một cái mông để gõ ra, các thanh về cơ bản có nghĩa là, có nghĩa là. Vậy x̄ đề cập đến giá trị trung bình của x

Vậy [x- x̄] là sự khác biệt giữa giá trị đó của x và giá trị trung bình của tất cả các giá trị x khác nhau

Đây được gọi là điểm lệch, có nghĩa là nó lệch bao xa so với giá trị

Giải thích nhanh về x- xbar

[xi-x̄] trông rất quen phải không?

Xem các giá trị trung bình hữu ích như thế nào. Điều này giải thích tại sao các thông số/số liệu thống kê lại quan trọng đến vậy

Một biểu tượng khác cần lưu ý là chiếc mũ

ŷ = y-mũ

làm thế nào tôi nhớ y-hat. anh chàng đội mũ phớt, luôn giả định, cố gắng dự đoán mọi thứ, rất có thể là sai

Điều này đề cập đến giá trị dự đoán của y từ một phương trình dự đoán

Nói cách khác, đúng hơn,

y = ax + b

nên là

ŷ = ax + b

Và lỗi về cơ bản là

REAL Y - PREDICTED Y

mà có thể được viết như

y - ŷ

Đây còn được gọi là phần dư. [Hãy nhớ bước đó trong Phần 1 về việc kiểm tra xem phần dư của bạn có phải là ngẫu nhiên và không hiển thị một mẫu không?]

Dù sao đi nữa vì cuộc sống thật khó khăn và phức tạp - tổng bình phương các lỗi trong dự đoán được viết là SSE

nhưng cũng có thể được gọi là

  • tổng bình phương còn lại [RSS]
  • tổng bình phương phần dư [SSR]
OK, QUÁ TRÌNH MÃ HÓA HẤP DẪN BẮT ĐẦU TẠI ĐÂY

Bây giờ chúng ta đã giải quyết được tất cả những phép toán đó, hãy viết mã cái thứ chết tiệt đó

Chúng ta sẽ bắt đầu sử dụng mô-đun Hồi quy tuyến tính từ thư viện sklearn trong Python. Điều này tương tự như mã một dòng mà tôi đã cung cấp trong Phần 1 cho R mà tôi đang sử dụng thứ gì đó đã được mã hóa trước để tìm đường hồi quy của mình

Tôi sẽ không đề cập đến mã Python ở đây, vì tôi không nghĩ mình đủ trình độ lol, nhưng tôi đã cố gắng hết sức để giải thích từng bước trong #comments trong chính mã đó

Yay và bạn đã hoàn thành việc tạo mô hình

Nhìn vào dòng tuyệt đẹp đó. Còn lời thoại hay hay không vẫn chưa quyết định [chờ Phần 3. chỉ cần chờ nó], nhưng hiện tại người ta đã quyết định rằng dòng này có ít SSE nhất [hoặc RSS hoặc SSR]

Tuy nhiên, vì tôi đã dành một lượng thời gian đáng kể để xem các phương trình đằng sau phương thức LinearRegression[], nên tôi muốn chứng minh rằng đó thực sự là phép toán đằng sau mô-đun python mà chúng ta vừa sử dụng

Hình 1 xuất hiện lần thứ 2

Ghi chú

ký hiệu power trong python KHÔNG phải là “ ^ “ , mà là “ ** “

Cả hai đều cho kết quả chính xác như nhau

Phương trình hồi quy là y = 1. 37x + 4. 27

AAND CHÚNG TÔI ĐÃ XONG

Hy vọng rằng bây giờ bạn đã hiểu rõ hơn về cách hoạt động của Hồi quy tuyến tính đơn giản. ] Tôi chắc chắn

Đây chỉ là bước đầu tiên để hồi quy tuyến tính, nhưng hãy tự mình thử. Tôi đã sử dụng bài đăng này như một hướng dẫn và nó đã được chứng minh là rất toàn diện, đặc biệt là đối với phần toán học

Bạn có thể thiết lập và viết mã trong Jupyter Notebook hoặc chỉ sử dụng Python IDE

Trong phần tiếp theo, tôi sẽ đề cập đến việc đánh giá độ chính xác của mô hình và cách rút ra dự đoán từ nó

GIỮ NGUYÊN

THÊM THÊM. Bối cảnh là quan trọng

Trong Phần 1, ví dụ tôi đã đưa ra về 'Nước mắt rơi' so với 'Điểm thi' là một ví dụ tồi tệ khi nghĩ lại

Số liệu thống kê có thể chứng minh mối tương quan càng nhiều càng tốt, HÃY LUÔN NHỚ RẰNG

** tương quan không phải là nhân quả **

niệm 6 lần điều này trong khi đối mặt với gương và hy vọng hồn ma Tương quan xuất hiện để ban phước lành cho bạn ~

Có lẽ số lần rơi nước mắt sẽ ảnh hưởng đến điểm số vì tôi càng dành nhiều thời gian để học càng khóc nhiều hơn [trong trường hợp đó, cách tốt hơn là lập mô hình Thời gian dành cho việc học so với Điểm thi], nhưng đây chỉ là giả định và nó có thể

Mối tương quan giữa số lần rơi nước mắt và điểm thi có thể là một…

*trống cuộn*

TƯƠNG QUAN GIẢI

Đây là lúc kiến ​​thức kinh doanh và lẽ thường phát huy tác dụng, và điều gì sẽ ngăn không cho máy móc đánh cắp công việc của bạn. Điều gì có liên quan và điều gì không chỉ được xác định bởi một chương trình. Lựa chọn tính năng là công việc của cả con người và máy tính

Kiểm tra các mối tương quan giả siêu thú vị của Tyler Vigen tại đây

Chúng ta đã đi đến cuối PHẦN 2. Cảm ơn bạn đã gắn bó cho đến nay. Hãy để mắt đến Phần 3 và hãy nhớ cho tôi biết nếu bạn phát hiện ra bất kỳ lỗi nào

Chủ Đề