Nhiều tập lệnh python hồi quy tuyến tính
Chiến lược mô hình hóa mối quan hệ giữa một tính năng phụ thuộc (biến mục tiêu) và một tính năng độc lập duy nhất (hồi quy đơn giản) hoặc nhiều tính năng độc lập (hồi quy bội) được gọi là hồi quy tuyến tính. Thuật toán hồi quy tuyến tính hoạt động dựa trên giả định rằng cả hai loại biến đều có mối quan hệ tuyến tính. Nếu mối quan hệ này tồn tại, chúng ta có thể tính toán các hệ số cần thiết của mô hình để đưa ra dự báo dựa trên dữ liệu mới hoặc dữ liệu chưa biết Show
Phân tích mô tả các biếnThông thường, bạn nên vẽ biểu đồ trực quan hóa dữ liệu để hiểu dữ liệu tốt hơn và kiểm tra xem có mối quan hệ nào giữa từng tính năng hay không trước khi tiếp tục áp dụng hồi quy đa tuyến tính. Chúng tôi sẽ sử dụng phương thức pairplot() từ gói Seaborn để vẽ mối quan hệ giữa các tính năng. Hàm sẽ tạo ra một hình có biểu đồ và biểu đồ phân tán kết nối từng tính năng Sử dụng nhiều thư viện khác nhau, bao gồm Numpy, Pandas, Scikit-Learn và Scipy, chúng ta sẽ tìm hiểu cách áp dụng và trực quan hóa quy trình hồi quy tuyến tính trong Python từ đầu trong hướng dẫn này Nhập thư việnChúng tôi sẽ nhập một số thư viện Python mà chúng tôi cần, chẳng hạn như NumPy, Pandas, sklearn, matplotlib, v.v. , trong bước đầu tiên của chúng tôi. Ngoài ra, chúng tôi sẽ sử dụng thư viện Pandas để tải tập dữ liệu từ kho lưu trữ GitHub và chuyển đổi tập dữ liệu thành khung dữ liệu có tên là df Mã số đầu ra (545, 4) price area bedrooms stories 0 13300000 7420 4 3 1 12250000 8960 4 4 2 12250000 9960 3 2 3 12215000 7500 4 2 4 11410000 7420 4 2 Lựa chọn tính năngChúng ta sẽ thấy mối quan hệ giữa các tính năng bằng cách sử dụng biểu đồ cặp Mã số đầu ra Chúng ta có thể thấy trong hàng đầu tiên của hình có mối quan hệ tuyến tính giữa giá và các đặc điểm khu vực của tập dữ liệu. Chúng ta có thể thấy rằng đồ thị phân tán của các biến còn lại là ngẫu nhiên và không thể hiện mối quan hệ nào giữa chúng. Chúng ta chỉ nên lấy một trong nhiều tính năng độc lập có mối quan hệ giữa chúng. Trong khi ở đây, giá là biến mục tiêu, vì vậy không cần phải giảm và làm nổi bật đa cộng tuyếnMô hình hồi quy tuyến tính bội giả định không tồn tại mối tương quan giữa các yếu tố dự đoán hoặc các biến độc lập được sử dụng trong hồi quy. Sử dụng phương thức corr() từ khung dữ liệu Pandas, chúng ta có thể tính toán giá trị hệ số tương quan Pearson giữa hai tính năng của dữ liệu và xây dựng ma trận để xem liệu có bất kỳ mối tương quan nào giữa bất kỳ yếu tố dự đoán nào không. Sau đó, chúng ta có thể sử dụng biểu đồ heatmap() của Seaborn để hiển thị ma trận dưới dạng bản đồ nhiệt Mã số đầu ra Pearson correlation coefficient matrix for each independent variable: area bedrooms stories area 1.000000 0.151858 0.083996 bedrooms 0.151858 1.000000 0.408564 stories 0.083996 0.408564 1.000000 Xây dựng mô hình hồi quy tuyến tính bộiHãy tiến tới phát triển mô hình hồi quy của chúng ta. Bây giờ chúng ta đã thấy không có mối quan hệ và cộng tuyến giữa các đặc trưng, chúng ta có thể sử dụng tất cả các đặc trưng để xây dựng mô hình. Chúng tôi sẽ sử dụng lớp LinearRegression() của thư viện linear_model của Sklearn để tạo các mô hình của chúng tôi Mã số đầu ra Intercept: 157155.2578429943 Coefficients array: [4.17726303e+02 4.18703502e+05 6.73797188e+05] Chúng tôi sẽ cố gắng chuyển đổi mô hình của mình thành biểu đồ ba chiều bằng cách sử dụng ô mã bên dưới. Điểm dữ liệu của chúng tôi sẽ được hiển thị trên biểu đồ dưới dạng các chấm màu xám và mô hình tuyến tính sẽ được biểu thị dưới dạng mặt phẳng màu xanh lam Bạn đang sống trong thời đại của lượng lớn dữ liệu, máy tính mạnh mẽ và trí tuệ nhân tạo. Điều này chỉ là khởi đầu. Khoa học dữ liệu và học máy đang thúc đẩy nhận dạng hình ảnh, phát triển phương tiện tự hành, các quyết định trong lĩnh vực tài chính và năng lượng, những tiến bộ trong y học, sự phát triển của mạng xã hội, v.v. Hồi quy tuyến tính là một phần quan trọng của điều này Hồi quy tuyến tính là một trong những kỹ thuật thống kê và học máy cơ bản. Cho dù bạn muốn làm thống kê, học máy hay , thì rất có thể bạn sẽ cần đến nó. Tốt nhất là xây dựng một nền tảng vững chắc trước rồi mới tiến tới các phương pháp phức tạp hơn Đến cuối bài viết này, bạn sẽ học được
Tiền thưởng miễn phí. hướng dẫn bạn các hướng dẫn, video và sách tốt nhất để cải thiện kỹ năng NumPy của bạn Lấy bài kiểm tra. Kiểm tra kiến thức của bạn với bài kiểm tra tương tác “Hồi quy tuyến tính trong Python” của chúng tôi. Sau khi hoàn thành, bạn sẽ nhận được điểm số để có thể theo dõi quá trình học tập của mình theo thời gian Lấy bài kiểm tra " hồi quyPhân tích hồi quy là một trong những lĩnh vực quan trọng nhất trong thống kê và học máy. Có nhiều phương pháp hồi quy có sẵn. Hồi quy tuyến tính là một trong số đó Loại bỏ các quảng cáoHồi quy là gì?Hồi quy tìm kiếm mối quan hệ giữa các biến. Ví dụ: bạn có thể quan sát một số nhân viên của một số công ty và cố gắng hiểu mức lương của họ phụ thuộc như thế nào vào các đặc điểm của họ, chẳng hạn như kinh nghiệm, trình độ học vấn, vai trò, thành phố làm việc, v.v. Đây là một vấn đề hồi quy trong đó dữ liệu liên quan đến mỗi nhân viên đại diện cho một quan sát. Giả định là kinh nghiệm, trình độ học vấn, vai trò và thành phố là những đặc điểm độc lập, trong khi mức lương phụ thuộc vào chúng Tương tự, bạn có thể thử thiết lập sự phụ thuộc toán học của giá nhà đất vào diện tích, số phòng ngủ, khoảng cách đến trung tâm thành phố, v.v. Nói chung, trong phân tích hồi quy, bạn xem xét một số hiện tượng quan tâm và có một số quan sát. Mỗi quan sát có hai hoặc nhiều tính năng. Theo giả định rằng ít nhất một trong số các tính năng phụ thuộc vào các tính năng khác, bạn cố gắng thiết lập mối quan hệ giữa chúng Nói cách khác, bạn cần tìm một hàm ánh xạ một số tính năng hoặc biến cho những tính năng hoặc biến khác đủ tốt Các tính năng phụ thuộc được gọi là biến phụ thuộc, đầu ra hoặc phản hồi. Các tính năng độc lập được gọi là các biến độc lập, đầu vào, hồi quy hoặc dự đoán Các bài toán hồi quy thường có một biến phụ thuộc liên tục và không bị chặn. Tuy nhiên, đầu vào có thể là dữ liệu liên tục, rời rạc hoặc thậm chí là dữ liệu phân loại như giới tính, quốc tịch hoặc thương hiệu Một thực tế phổ biến là biểu thị đầu ra bằng 𝑦 và đầu vào bằng 𝑥. Nếu có hai hoặc nhiều biến độc lập, thì chúng có thể được biểu diễn dưới dạng vectơ 𝐱 = (𝑥₁, …, 𝑥ᵣ), trong đó 𝑟 là số lượng đầu vào Khi nào bạn cần hồi quy?Thông thường, bạn cần hồi quy để trả lời liệu một số hiện tượng có ảnh hưởng đến hiện tượng kia hay không và một số biến có liên quan như thế nào. Ví dụ: bạn có thể sử dụng nó để xác định xem kinh nghiệm hoặc giới tính có ảnh hưởng đến tiền lương hay không và ở mức độ nào Hồi quy cũng hữu ích khi bạn muốn dự đoán phản hồi bằng cách sử dụng một bộ dự đoán mới. Ví dụ: bạn có thể thử dự đoán mức tiêu thụ điện của một hộ gia đình trong giờ tiếp theo dựa trên nhiệt độ ngoài trời, thời gian trong ngày và số lượng cư dân trong hộ gia đình đó Hồi quy được sử dụng trong nhiều lĩnh vực khác nhau, bao gồm kinh tế, khoa học máy tính và khoa học xã hội. Tầm quan trọng của nó tăng lên mỗi ngày với sự sẵn có của một lượng lớn dữ liệu và nâng cao nhận thức về giá trị thực tế của dữ liệu hồi quy tuyến tínhHồi quy tuyến tính có lẽ là một trong những kỹ thuật hồi quy quan trọng nhất và được sử dụng rộng rãi. Đó là một trong những phương pháp hồi quy đơn giản nhất. Một trong những ưu điểm chính của nó là dễ dàng giải thích kết quả Xây dựng vấn đềKhi thực hiện hồi quy tuyến tính của một số biến phụ thuộc 𝑦 trên tập hợp các biến độc lập 𝐱 = (𝑥₁, …, 𝑥ᵣ), trong đó 𝑟 là số biến dự đoán, bạn giả sử mối quan hệ tuyến tính giữa 𝑦 và 𝐱. 𝑦 = 𝛽₀ + 𝛽₁𝑥₁ + ⋯ + 𝛽ᵣ𝑥ᵣ + 𝜀. Phương trình này là phương trình hồi quy. 𝛽₀, 𝛽₁, …, 𝛽ᵣ là các hệ số hồi quy và 𝜀 là sai số ngẫu nhiên Hồi quy tuyến tính tính toán các ước lượng của các hệ số hồi quy hoặc đơn giản là trọng số dự đoán, được biểu thị bằng 𝑏₀, 𝑏₁, …, 𝑏ᵣ. Các công cụ ước tính này xác định hàm hồi quy ước tính 𝑓(𝐱) = 𝑏₀ + 𝑏₁𝑥₁ + ⋯ + 𝑏ᵣ𝑥ᵣ. Chức năng này sẽ nắm bắt đủ tốt sự phụ thuộc giữa đầu vào và đầu ra Phản hồi ước tính hoặc dự đoán, 𝑓(𝐱ᵢ), cho mỗi quan sát 𝑖 = 1, …, 𝑛, phải càng gần càng tốt với phản hồi thực tế tương ứng 𝑦ᵢ. Hiệu 𝑦ᵢ - 𝑓(𝐱ᵢ) đối với tất cả các quan sát 𝑖 = 1, …, 𝑛, được gọi là phần dư. Hồi quy là về việc xác định các trọng số được dự đoán tốt nhất, tức là các trọng số tương ứng với phần dư nhỏ nhất Để có được trọng số tốt nhất, bạn thường giảm thiểu tổng bình phương phần dư (SSR) cho tất cả các quan sát 𝑖 = 1, …, 𝑛. SSR = Σᵢ(𝑦ᵢ - 𝑓(𝐱ᵢ))². Phương pháp này được gọi là phương pháp bình phương nhỏ nhất thông thường Loại bỏ các quảng cáoHiệu suất hồi quySự thay đổi của các phản ứng thực tế 𝑦ᵢ, 𝑖 = 1, …, 𝑛, xảy ra một phần do sự phụ thuộc vào các yếu tố dự đoán 𝐱ᵢ. Tuy nhiên, cũng có một phương sai cố hữu bổ sung của đầu ra Hệ số xác định, được ký hiệu là 𝑅², cho bạn biết lượng biến thiên trong 𝑦 có thể được giải thích bằng sự phụ thuộc vào 𝐱, sử dụng mô hình hồi quy cụ thể. 𝑅² lớn hơn cho thấy mức độ phù hợp tốt hơn và có nghĩa là mô hình có thể giải thích tốt hơn sự thay đổi của đầu ra với các đầu vào khác nhau Giá trị 𝑅² = 1 tương ứng với SSR = 0. Đó là sự phù hợp hoàn hảo, vì các giá trị của phản hồi dự đoán và phản hồi thực tế hoàn toàn khớp với nhau Hồi quy tuyến tính cơ bảnHồi quy tuyến tính đơn biến hoặc đơn biến là trường hợp đơn giản nhất của hồi quy tuyến tính, vì nó có một biến độc lập duy nhất, 𝐱 = 𝑥 Hình dưới đây minh họa hồi quy tuyến tính đơn giản Ví dụ về hồi quy tuyến tính đơn giảnKhi triển khai hồi quy tuyến tính đơn giản, bạn thường bắt đầu với một tập hợp các cặp đầu vào-đầu ra (𝑥-𝑦) nhất định. Các cặp này là quan sát của bạn, được hiển thị dưới dạng các vòng tròn màu xanh lá cây trong hình. Ví dụ: quan sát ngoài cùng bên trái có đầu vào 𝑥 = 5 và đầu ra thực tế hoặc phản hồi, 𝑦 = 5. Cái tiếp theo có 𝑥 = 15 và 𝑦 = 20, v.v. Hàm hồi quy ước tính, được biểu thị bằng đường màu đen, có phương trình 𝑓(𝑥) = 𝑏₀ + 𝑏₁𝑥. Mục tiêu của bạn là tính toán các giá trị tối ưu của trọng số dự đoán 𝑏₀ và 𝑏₁ để giảm thiểu SSR và xác định hàm hồi quy ước tính Giá trị của 𝑏₀, còn được gọi là giao điểm, cho biết điểm mà tại đó đường hồi quy ước lượng cắt qua trục 𝑦. Đó là giá trị của phản hồi ước tính 𝑓(𝑥) cho 𝑥 = 0. Giá trị của 𝑏₁ xác định độ dốc của đường hồi quy ước lượng Các câu trả lời dự đoán, được hiển thị dưới dạng hình vuông màu đỏ, là các điểm trên đường hồi quy tương ứng với các giá trị đầu vào. Ví dụ: đối với đầu vào 𝑥 = 5, phản hồi dự đoán là 𝑓(5) = 8. 33, hình vuông màu đỏ ngoài cùng bên trái đại diện cho Các đường màu xám đứt nét dọc biểu thị phần dư, có thể được tính như 𝑦ᵢ - 𝑓(𝐱ᵢ) = 𝑦ᵢ - 𝑏₀ - 𝑏₁𝑥ᵢ cho 𝑖 = 1, …, 𝑛. Chúng là khoảng cách giữa các hình tròn màu xanh lá cây và hình vuông màu đỏ. Khi bạn triển khai hồi quy tuyến tính, thực tế là bạn đang cố gắng giảm thiểu những khoảng cách này và làm cho hình vuông màu đỏ càng gần với hình tròn màu xanh lá cây được xác định trước càng tốt Nhiều hồi quy tuyến tínhHồi quy tuyến tính nhiều biến hoặc đa biến là trường hợp hồi quy tuyến tính có hai biến độc lập trở lên Nếu chỉ có hai biến độc lập thì hàm hồi quy ước tính là 𝑓(𝑥₁, 𝑥₂) = 𝑏₀ + 𝑏₁𝑥₁ + 𝑏₂𝑥₂. Nó đại diện cho một mặt phẳng hồi quy trong không gian ba chiều. Mục tiêu của hồi quy là xác định giá trị của các trọng số 𝑏₀, 𝑏₁ và 𝑏₂ sao cho mặt phẳng này càng gần với phản hồi thực tế càng tốt, đồng thời mang lại SSR tối thiểu Trường hợp có nhiều hơn hai biến độc lập cũng tương tự nhưng tổng quát hơn. Hàm hồi quy ước lượng là 𝑓(𝑥₁, …, 𝑥ᵣ) = 𝑏₀ + 𝑏₁𝑥₁ + ⋯ +𝑏ᵣ𝑥ᵣ, và có 𝑟 + 1 trọng số được xác định khi số lượng đầu vào là 𝑟 hồi quy đa thứcBạn có thể coi hồi quy đa thức là một trường hợp tổng quát của hồi quy tuyến tính. Bạn giả sử sự phụ thuộc đa thức giữa đầu ra và đầu vào và do đó, hàm hồi quy ước tính đa thức Nói cách khác, ngoài các số hạng tuyến tính như 𝑏₁𝑥₁, hàm hồi quy 𝑓 của bạn có thể bao gồm các số hạng phi tuyến tính như 𝑏₂𝑥₁², 𝑏₃𝑥₁³ hoặc thậm chí 𝑏₄𝑥₁𝑥₂, 𝑏₅²𝑥₁𝑥₂ Ví dụ đơn giản nhất về hồi quy đa thức có một biến độc lập duy nhất và hàm hồi quy ước tính là một đa thức bậc hai. 𝑓(𝑥) = 𝑏₀ + 𝑏₁𝑥 + 𝑏₂𝑥² Bây giờ, hãy nhớ rằng bạn muốn tính 𝑏₀, 𝑏₁ và 𝑏₂ để giảm thiểu SSR. Đây là những ẩn số của bạn Lưu ý điều này, hãy so sánh hàm hồi quy trước đó với hàm 𝑓(𝑥₁, 𝑥₂) = 𝑏₀ + 𝑏₁𝑥₁ + 𝑏₂𝑥₂, dùng cho hồi quy tuyến tính. Chúng trông rất giống nhau và đều là hàm tuyến tính của các ẩn số 𝑏₀, 𝑏₁ và 𝑏₂. Đây là lý do tại sao bạn có thể giải bài toán hồi quy đa thức dưới dạng bài toán tuyến tính với số hạng 𝑥² được coi là một biến đầu vào Trong trường hợp hai biến và đa thức bậc hai, hàm hồi quy có dạng này. 𝑓(𝑥₁, 𝑥₂) = 𝑏₀ + 𝑏₁𝑥₁ + 𝑏₂𝑥₂ + 𝑏₃𝑥₁² + 𝑏₄𝑥₁𝑥₂ + 𝑏₅𝑥₂² Thủ tục giải quyết vấn đề giống hệt với trường hợp trước. Bạn áp dụng hồi quy tuyến tính cho năm yếu tố đầu vào. 𝑥₁, 𝑥₂, 𝑥₁², 𝑥₁𝑥₂ và 𝑥₂². Là kết quả của hồi quy, bạn nhận được các giá trị của sáu trọng số giúp giảm thiểu SSR. 𝑏₀, 𝑏₁, 𝑏₂, 𝑏₃, 𝑏₄ và 𝑏₅ Tất nhiên, có nhiều vấn đề tổng quát hơn, nhưng điều này là đủ để minh họa điểm Loại bỏ các quảng cáoMặc thiếu và mặc quá nhiềuMột câu hỏi rất quan trọng có thể phát sinh khi bạn thực hiện hồi quy đa thức có liên quan đến việc lựa chọn bậc tối ưu của hàm hồi quy đa thức Không có quy tắc đơn giản để làm điều này. Nó phụ thuộc vào trường hợp. Tuy nhiên, bạn nên lưu ý hai vấn đề có thể xảy ra sau khi chọn bằng cấp. trang bị thiếu và trang bị quá nhiều Thiếu phù hợp xảy ra khi một mô hình không thể nắm bắt chính xác sự phụ thuộc giữa các dữ liệu, thường là do tính đơn giản của chính nó. Nó thường mang lại 𝑅² thấp với dữ liệu đã biết và khả năng khái quát hóa kém khi áp dụng với dữ liệu mới Quá khớp xảy ra khi một mô hình học cả phụ thuộc dữ liệu và dao động ngẫu nhiên. Nói cách khác, một mô hình học dữ liệu hiện có quá tốt. Các mô hình phức tạp, có nhiều tính năng hoặc thuật ngữ, thường dễ bị quá khớp. Khi áp dụng cho dữ liệu đã biết, các mô hình như vậy thường mang lại 𝑅² cao. Tuy nhiên, chúng thường không tổng quát hóa tốt và có 𝑅² thấp hơn đáng kể khi được sử dụng với dữ liệu mới Hình tiếp theo minh họa các mô hình vừa vặn, vừa vặn và quá vừa vặn Ví dụ về các mô hình trang bị quá mức, trang bị vừa vặn và trang bị quá mứcBiểu đồ trên cùng bên trái hiển thị một đường hồi quy tuyến tính có 𝑅² thấp. Điều quan trọng nữa là một đường thẳng không thể tính đến thực tế là phản hồi thực tế tăng lên khi 𝑥 di chuyển ra khỏi 25 và về 0. Đây có thể là một ví dụ về trang phục không phù hợp Biểu đồ trên cùng bên phải minh họa hồi quy đa thức với mức độ bằng hai. Trong trường hợp này, đây có thể là mức độ tối ưu để mô hình hóa dữ liệu này. Mô hình có giá trị 𝑅² thỏa đáng trong nhiều trường hợp và thể hiện xu hướng một cách độc đáo Biểu đồ dưới cùng bên trái trình bày hồi quy đa thức với mức độ bằng ba. Giá trị của 𝑅² cao hơn trong các trường hợp trước. Mô hình này hoạt động tốt hơn với dữ liệu đã biết so với mô hình trước đó. Tuy nhiên, nó cho thấy một số dấu hiệu của việc khớp quá mức, đặc biệt là đối với các giá trị đầu vào gần bằng sáu, khi đường bắt đầu giảm, mặc dù dữ liệu thực tế không cho thấy điều đó Cuối cùng, trên biểu đồ dưới cùng bên phải, bạn có thể thấy sự phù hợp hoàn hảo. sáu điểm và đường đa thức bậc năm (hoặc cao hơn) mang lại 𝑅² = 1. Mỗi phản hồi thực tế bằng dự đoán tương ứng của nó Trong một số trường hợp, đây có thể chính xác là thứ bạn đang tìm kiếm. Tuy nhiên, trong nhiều trường hợp, đây là một mô hình được trang bị quá mức. Nó có thể có hành vi kém với dữ liệu không nhìn thấy, đặc biệt là với đầu vào lớn hơn năm mươi Ví dụ: nó giả định, không có bất kỳ bằng chứng nào, rằng có sự sụt giảm đáng kể trong các phản hồi cho 𝑥 lớn hơn năm mươi và 𝑦 đạt đến 0 cho 𝑥 gần sáu mươi. Hành vi như vậy là kết quả của nỗ lực quá mức để tìm hiểu và phù hợp với dữ liệu hiện có Có rất nhiều tài nguyên mà bạn có thể tìm thêm thông tin về hồi quy nói chung và hồi quy tuyến tính nói riêng. Trang phân tích hồi quy trên Wikipedia, mục hồi quy tuyến tính của Wikipedia và bài viết về hồi quy tuyến tính của Khan Academy là những điểm khởi đầu tốt Gói Python cho hồi quy tuyến tínhĐã đến lúc bắt đầu triển khai hồi quy tuyến tính trong Python. Để làm điều này, bạn sẽ áp dụng các gói thích hợp cũng như các hàm và lớp của chúng NumPy là một gói khoa học cơ bản của Python cho phép nhiều hoạt động hiệu suất cao trên các mảng một chiều và nhiều chiều. Nó cũng cung cấp nhiều thói quen toán học. Tất nhiên, đó là mã nguồn mở Nếu bạn không quen thuộc với NumPy, bạn có thể sử dụng Hướng dẫn sử dụng NumPy chính thức và đọc Hướng dẫn NumPy. Những bước đầu tiên của bạn vào khoa học dữ liệu trong Python. Ngoài ra, Look Ma, No-Loops. Lập trình mảng với NumPy và Pure Python so với NumPy so với TensorFlow So sánh hiệu suất có thể cho bạn ý tưởng tốt về mức tăng hiệu suất mà bạn có thể đạt được khi áp dụng NumPy Gói scikit-learning là một thư viện Python được sử dụng rộng rãi cho máy học, được xây dựng dựa trên NumPy và một số gói khác. Nó cung cấp phương tiện để xử lý trước dữ liệu, giảm kích thước, thực hiện hồi quy, phân loại, phân cụm, v.v. Giống như NumPy, scikit-learning cũng là mã nguồn mở Bạn có thể kiểm tra trang Mô hình tuyến tính tổng quát trên trang web scikit-learn để tìm hiểu thêm về các mô hình tuyến tính và hiểu sâu hơn về cách thức hoạt động của gói này Nếu bạn muốn triển khai hồi quy tuyến tính và cần chức năng ngoài phạm vi của scikit-learning, bạn nên xem xét các mô hình thống kê. Đó là gói Python mạnh mẽ để ước tính các mô hình thống kê, thực hiện các bài kiểm tra, v.v. Nó cũng là mã nguồn mở Bạn có thể tìm thêm thông tin về mô hình thống kê trên trang web chính thức của nó Bây giờ, để làm theo hướng dẫn này, bạn nên cài đặt tất cả các gói này vào một môi trường ảo
Điều này sẽ cài đặt NumPy, scikit-learning, statsmodels và các phần phụ thuộc của chúng Loại bỏ các quảng cáoHồi quy tuyến tính đơn giản với scikit-learningBạn sẽ bắt đầu với trường hợp đơn giản nhất, đó là hồi quy tuyến tính đơn giản. Có năm bước cơ bản khi bạn triển khai hồi quy tuyến tính
Các bước này ít nhiều mang tính tổng quát đối với hầu hết các cách tiếp cận và triển khai hồi quy. Trong suốt phần còn lại của hướng dẫn, bạn sẽ học cách thực hiện các bước này cho một số tình huống khác nhau Bước 1. Nhập gói và lớp Bước đầu tiên là nhập gói 6 và lớp 7 từ 8>>>
Bây giờ, bạn có tất cả các chức năng cần thiết để triển khai hồi quy tuyến tính Kiểu dữ liệu cơ bản của NumPy là kiểu mảng có tên là 9. Phần còn lại của hướng dẫn này sử dụng mảng thuật ngữ để chỉ các thể hiện của loại 9Bạn sẽ sử dụng lớp 1 để thực hiện hồi quy tuyến tính và đa thức và đưa ra dự đoán tương ứngBước 2. Cung cấp dữ liệu Bước thứ hai là xác định dữ liệu để làm việc với. Đầu vào (biến hồi quy, 𝑥) và đầu ra (phản hồi, 𝑦) phải là mảng hoặc đối tượng tương tự. Đây là cách đơn giản nhất để cung cấp dữ liệu cho hồi quy >>>
Bây giờ, bạn có hai mảng. đầu vào, 2 và đầu ra, 3. Bạn nên gọi 4 trên 2 vì mảng này phải là mảng hai chiều, hay chính xác hơn là phải có một cột và bao nhiêu hàng tùy ý. Đó chính xác là điều mà lập luận của 6 của 4 chỉ raĐây là giao diện của 2 và 3>>>
Như bạn có thể thấy, 2 có hai chiều và 1 là 2, trong khi 3 có một chiều và 4 là 5Bước 3. Tạo một mô hình và phù hợp với nó Bước tiếp theo là tạo một mô hình hồi quy tuyến tính và điều chỉnh nó bằng dữ liệu hiện có Tạo một thể hiện của lớp 7, lớp này sẽ đại diện cho mô hình hồi quy>>>
Câu lệnh này tạo biến 7 như một thể hiện của 7. Bạn có thể cung cấp một số tham số tùy chọn cho 7
7 của bạn như được định nghĩa ở trên sử dụng các giá trị mặc định của tất cả các tham sốĐã đến lúc bắt đầu sử dụng mô hình. Trước tiên, bạn cần gọi cho 6 vào ngày 7>>>
Với 6, bạn tính toán các giá trị tối ưu của trọng số 𝑏₀ và 𝑏₁, sử dụng đầu vào và đầu ra hiện có, 2 và 3, làm đối số. Nói cách khác, 6 phù hợp với mô hình. Nó trả về 2, chính là biến 7. Đó là lý do tại sao bạn có thể thay thế hai câu lệnh cuối cùng bằng câu lệnh này>>>
Câu lệnh này thực hiện tương tự như hai câu trước. Nó chỉ ngắn hơn Bước 4. Nhận kết quả Khi bạn đã lắp mô hình của mình, bạn có thể nhận kết quả để kiểm tra xem mô hình có hoạt động tốt hay không và để giải thích nó Bạn có thể nhận được hệ số xác định, 𝑅², với 4 được gọi trên 7>>>
Khi bạn đang áp dụng 4, các đối số cũng là yếu tố dự đoán 2 và phản hồi 3, và giá trị trả về là 𝑅²Các thuộc tính của 7 là 00, đại diện cho hệ số 𝑏₀ và 01, đại diện cho 𝑏₁>>>
Đoạn mã trên minh họa cách lấy 𝑏₀ và 𝑏₁. Bạn có thể nhận thấy rằng 00 là một số vô hướng, trong khi 01 là một mảngGhi chú. Trong scikit-learning, by , dấu gạch dưới ở cuối cho biết rằng một thuộc tính được ước tính. Trong ví dụ này, 00 và 01 là các giá trị ước tínhGiá trị của 𝑏₀ xấp xỉ 5. 63. Điều này minh họa rằng mô hình của bạn dự đoán phản hồi 5. 63 khi 𝑥 bằng không. Giá trị 𝑏₁ = 0. 54 có nghĩa là phản hồi dự đoán tăng 0. 54 khi 𝑥 tăng thêm một Bạn sẽ nhận thấy rằng bạn cũng có thể cung cấp 3 dưới dạng mảng hai chiều. Trong trường hợp này, bạn sẽ nhận được kết quả tương tự. Đây là cách nó có thể trông>>>
Như bạn có thể thấy, ví dụ này rất giống với ví dụ trước, nhưng trong trường hợp này, 00 là mảng một chiều với phần tử đơn 𝑏₀ và 01 là mảng hai chiều với phần tử đơn 𝑏₁Bước 5. Dự đoán phản hồi Khi bạn có một mô hình ưng ý, thì bạn có thể sử dụng nó để dự đoán với dữ liệu hiện có hoặc dữ liệu mới. Để có được phản hồi dự đoán, hãy sử dụng 09>>> 0Khi áp dụng 09, bạn chuyển biến hồi quy làm đối số và nhận được phản hồi dự đoán tương ứng. Đây là một cách gần như giống hệt nhau để dự đoán phản hồi>>> 1Trong trường hợp này, bạn nhân mỗi phần tử của 2 với 12 và thêm 13 vào tíchĐầu ra ở đây chỉ khác với ví dụ trước về kích thước. Phản hồi dự đoán bây giờ là một mảng hai chiều, trong khi ở trường hợp trước, nó có một chiều Nếu bạn giảm số chiều của 2 xuống còn một, thì hai cách tiếp cận này sẽ cho cùng một kết quả. Bạn có thể làm điều này bằng cách thay thế 2 bằng 16, 17 hoặc 18 khi nhân nó với 12Trong thực tế, mô hình hồi quy thường được áp dụng để dự báo. Điều này có nghĩa là bạn có thể sử dụng các mô hình phù hợp để tính toán đầu ra dựa trên đầu vào mới >>> 2Ở đây 09 được áp dụng cho biến hồi quy mới 21 và mang lại phản hồi 22. Ví dụ này thuận tiện sử dụng 23 từ 6 để tạo một mảng có các phần tử từ 0, bao gồm, cho đến nhưng không bao gồm 5—nghĩa là, 25, 26, 27, 28 và 29Bạn có thể tìm thêm thông tin về 7 trên trang tài liệu chính thứcLoại bỏ các quảng cáoNhiều hồi quy tuyến tính với scikit-learningBạn có thể triển khai hồi quy tuyến tính bội theo các bước tương tự như đối với hồi quy đơn giản. Sự khác biệt chính là mảng 2 của bạn bây giờ sẽ có hai cột trở lênBước 1 và 2. Nhập các gói và lớp và cung cấp dữ liệu Trước tiên, bạn nhập 6 và 1 và cung cấp đầu vào và đầu ra đã biết>>> 3Đó là một cách đơn giản để xác định đầu vào 2 và đầu ra 3. Bạn có thể in 2 và 3 để xem chúng trông như thế nào bây giờ>>> 4Trong hồi quy tuyến tính bội, 2 là mảng hai chiều có ít nhất hai cột, trong khi 3 thường là mảng một chiều. Đây là một ví dụ đơn giản về hồi quy tuyến tính bội và 2 có đúng hai cộtBước 3. Tạo một mô hình và phù hợp với nó Bước tiếp theo là tạo mô hình hồi quy dưới dạng một thể hiện của 7 và khớp nó với 6>>>
Kết quả của câu lệnh này là biến 7 tham chiếu đến đối tượng kiểu 7. Nó đại diện cho mô hình hồi quy phù hợp với dữ liệu hiện cóBước 4. Nhận kết quả Bạn có thể thu được các thuộc tính của mô hình giống như trong trường hợp hồi quy tuyến tính đơn giản >>> 6Bạn nhận được giá trị của 𝑅² bằng cách sử dụng 4 và các giá trị của các ước lượng của hệ số hồi quy với 00 và 01. Một lần nữa, 00 giữ độ lệch 𝑏₀, trong khi bây giờ 01 là một mảng chứa 𝑏₁ và 𝑏₂Trong ví dụ này, hệ số chặn xấp xỉ 5. 52, và đây là giá trị của phản hồi dự đoán khi 𝑥₁ = 𝑥₂ = 0. Tăng 𝑥₁ lên 1 thì phản hồi dự đoán tăng lên 0. 45. Tương tự, khi 𝑥₂ tăng lên 1, phản hồi tăng lên 0. 26 Bước 5. Dự đoán phản hồi Dự đoán cũng hoạt động giống như trong trường hợp hồi quy tuyến tính đơn giản >>> 7Phản hồi dự đoán thu được với 09, tương đương với sau>>> 8Bạn có thể dự đoán các giá trị đầu ra bằng cách nhân từng cột của đầu vào với trọng số thích hợp, tính tổng các kết quả và thêm phần chặn vào tổng Bạn cũng có thể áp dụng mô hình này cho dữ liệu mới >>> 9Đó là dự đoán sử dụng mô hình hồi quy tuyến tính Hồi quy đa thức với scikit-learningThực hiện hồi quy đa thức với scikit-learning rất giống với hồi quy tuyến tính. Chỉ còn một bước nữa. bạn cần chuyển đổi mảng đầu vào để bao gồm các thuật ngữ phi tuyến tính, chẳng hạn như 𝑥² Bước 1. Nhập gói và lớp Ngoài 6 và 1, bạn cũng nên nhập lớp 53 từ 54>>> 0Quá trình nhập hiện đã hoàn tất và bạn có mọi thứ bạn cần để làm việc với Bước 2a. Cung cấp dữ liệu Bước này xác định đầu vào và đầu ra và giống như trong trường hợp hồi quy tuyến tính >>> 1Bây giờ bạn có đầu vào và đầu ra ở định dạng phù hợp. Hãy nhớ rằng bạn cần đầu vào là một mảng hai chiều. Đó là lý do tại sao 4 được sử dụngBước 2b. Chuyển đổi dữ liệu đầu vào Đây là bước mới mà bạn cần thực hiện cho hồi quy đa thức Như bạn đã học trước đó, bạn cần bao gồm 𝑥²—và có lẽ các thuật ngữ khác—như các tính năng bổ sung khi triển khai hồi quy đa thức. Vì lý do đó, bạn nên chuyển đổi mảng đầu vào 2 để chứa bất kỳ cột bổ sung nào có giá trị 𝑥² và cuối cùng là nhiều tính năng hơnCó thể chuyển đổi mảng đầu vào theo nhiều cách, chẳng hạn như sử dụng 57 từ 6. Nhưng lớp 53 rất thuận tiện cho mục đích này. Hãy tiếp tục và tạo một thể hiện của lớp này>>> 2Biến 60 đề cập đến một thể hiện của 53 mà bạn có thể sử dụng để chuyển đổi đầu vào 2Bạn có thể cung cấp một số tham số tùy chọn cho 53
Ví dụ này sử dụng các giá trị mặc định của tất cả các tham số ngoại trừ 70. Đôi khi, bạn sẽ muốn thử nghiệm mức độ của hàm và việc cung cấp đối số này có thể có ích cho khả năng đọcTrước khi áp dụng 60, bạn cần lắp nó với 6>>> 3Khi 60 được trang bị, thì nó đã sẵn sàng để tạo một mảng đầu vào mới, đã sửa đổi. Bạn áp dụng 79 để làm điều đó>>> 4Đó là phép biến đổi mảng đầu vào với 79. Nó lấy mảng đầu vào làm đối số và trả về mảng đã sửa đổiBạn cũng có thể sử dụng 81 để thay thế ba câu trước chỉ bằng một>>> 5Với 81, bạn đang điều chỉnh và chuyển đổi mảng đầu vào trong một câu lệnh. Phương thức này cũng lấy mảng đầu vào và thực hiện tương tự như 6 và 79 được gọi theo thứ tự đó. Nó cũng trả về mảng đã sửa đổi. Đây là giao diện của mảng đầu vào mới>>> 6Mảng đầu vào đã sửa đổi chứa hai cột. một cái có đầu vào ban đầu và cái kia có hình vuông của chúng. Bạn có thể tìm thêm thông tin về 53 trên trang tài liệu chính thứcBước 3. Tạo một mô hình và phù hợp với nó Bước này cũng giống như trong trường hợp hồi quy tuyến tính. Bạn tạo và phù hợp với mô hình >>> 7Mô hình hồi quy hiện đã được tạo và trang bị. Nó đã sẵn sàng cho ứng dụng. Bạn nên nhớ rằng đối số đầu tiên của 6 là mảng đầu vào đã được sửa đổi 87 chứ không phải mảng gốc 2Bước 4. Nhận kết quả Bạn có thể thu được các thuộc tính của mô hình giống như trong trường hợp hồi quy tuyến tính >>> 8Một lần nữa, 4 trả về 𝑅². Đối số đầu tiên của nó cũng là đầu vào đã sửa đổi 87, không phải 2. Các giá trị của trọng số được liên kết với 00 và 01. Ở đây, 00 đại diện cho 𝑏₀, trong khi 01 tham chiếu mảng chứa 𝑏₁ và 𝑏₂Bạn có thể thu được một kết quả rất giống với các đối số biến đổi và hồi quy khác nhau >>> 9Nếu bạn gọi 53 với tham số mặc định là 97, hoặc nếu bạn chỉ bỏ qua nó, thì bạn sẽ nhận được mảng đầu vào mới 87 với cột ngoài cùng bên trái bổ sung chỉ chứa các giá trị 26. Cột này tương ứng với phần chặn. Đây là cách mảng đầu vào đã sửa đổi trông như thế nào trong trường hợp này>>> 0Cột đầu tiên của 87 chứa các giá trị đơn vị, cột thứ hai chứa các giá trị của 2, trong khi cột thứ ba chứa các ô vuông của 2Phần chặn đã được bao gồm trong cột ngoài cùng bên trái và bạn không cần bao gồm lại phần chặn này khi tạo phiên bản của 7. Vì vậy, bạn có thể cung cấp 04. Đây là cách câu lệnh tiếp theo trông như thế nào>>> 1Biến 7 lại tương ứng với mảng đầu vào mới 87. Do đó, 87 nên được chuyển làm đối số đầu tiên thay vì 2Cách tiếp cận này mang lại kết quả sau, tương tự như trường hợp trước >>> 2Bạn thấy rằng bây giờ 00 bằng 0, nhưng thực ra 01 chứa 𝑏₀ là phần tử đầu tiên của nó. Mọi thứ khác là như nhauBước 5. Dự đoán phản hồi Nếu bạn muốn nhận được phản hồi dự đoán, chỉ cần sử dụng 09, nhưng hãy nhớ rằng đối số phải là đầu vào đã sửa đổi 87 thay vì 2 cũ>>> 3Như bạn có thể thấy, dự đoán hoạt động gần giống như trong trường hợp hồi quy tuyến tính. Nó chỉ yêu cầu đầu vào đã sửa đổi thay vì đầu vào ban đầu Bạn có thể áp dụng quy trình giống hệt nếu bạn có nhiều biến đầu vào. Bạn sẽ có một mảng đầu vào có nhiều hơn một cột, nhưng mọi thứ khác sẽ giống nhau. Đây là một ví dụ >>> 4Ví dụ hồi quy này mang lại các kết quả và dự đoán sau >>> 5Trong trường hợp này, có sáu hệ số hồi quy, bao gồm cả hệ số chặn, như thể hiện trong hàm hồi quy ước lượng 𝑓(𝑥₁, 𝑥₂) = 𝑏₀ + 𝑏₁𝑥₁ + 𝑏₂𝑥₂ + 𝑏₃𝑥₁² + 𝑏₄𝑥₁𝑥₅ + 𝑥₥² Bạn cũng có thể nhận thấy rằng hồi quy đa thức mang lại hệ số xác định cao hơn so với hồi quy tuyến tính bội cho cùng một vấn đề. Lúc đầu, bạn có thể nghĩ rằng nhận được 𝑅² lớn như vậy là một kết quả tuyệt vời. Có thể là Tuy nhiên, trong các tình huống thực tế, việc có một mô hình phức tạp và 𝑅² rất gần với một mô hình cũng có thể là dấu hiệu của việc trang bị quá mức. Để kiểm tra hiệu suất của một mô hình, bạn nên kiểm tra nó với dữ liệu mới—nghĩa là với các quan sát không được sử dụng để điều chỉnh hoặc đào tạo mô hình. Để tìm hiểu cách chia tập dữ liệu của bạn thành các tập con đào tạo và kiểm tra, hãy xem Chia tập dữ liệu của bạn bằng scikit-learn's train_test_split() Loại bỏ các quảng cáoHồi quy tuyến tính nâng cao với mô hình thống kêBạn cũng có thể triển khai hồi quy tuyến tính trong Python bằng cách sử dụng gói statsmodels. Thông thường, điều này là mong muốn khi bạn cần kết quả chi tiết hơn Quy trình này tương tự như quy trình của scikit-learning Bước 1. gói nhập khẩu Trước tiên, bạn cần thực hiện một số thao tác nhập. Ngoài 6, bạn cần nhập khẩu 15>>> 6Bây giờ bạn có các gói mà bạn cần Bước 2. Cung cấp dữ liệu và chuyển đổi đầu vào Bạn có thể cung cấp đầu vào và đầu ra giống như cách bạn đã làm khi sử dụng scikit-learning >>> 7Mảng đầu vào và đầu ra được tạo, nhưng công việc vẫn chưa hoàn thành Bạn cần thêm cột đơn vị vào đầu vào nếu bạn muốn mô hình thống kê tính toán hệ số chặn 𝑏₀. Nó không tính đến 𝑏₀ theo mặc định. Đây chỉ là một cuộc gọi chức năng >>> 8Đó là cách bạn thêm cột một vào 2 với 17. Nó lấy mảng đầu vào 2 làm đối số và trả về một mảng mới với cột của những cái được chèn ở đầu. Đây là giao diện của 2 và 3>>> 9Bạn có thể thấy rằng 2 đã sửa đổi có ba cột. cột đầu tiên của các đơn vị, tương ứng với 𝑏₀ và thay thế phần chặn, cũng như hai cột của các tính năng ban đầuBước 3. Tạo một mô hình và phù hợp với nó Mô hình hồi quy dựa trên bình phương nhỏ nhất thông thường là một thể hiện của lớp 22. Đây là cách bạn có thể có được một>>> 0Bạn nên cẩn thận ở đây. Lưu ý rằng đối số đầu tiên là đầu ra, theo sau là đầu vào. Đây là thứ tự ngược lại của các hàm scikit-learning tương ứng Có thêm một số thông số tùy chọn. Để tìm thêm thông tin về lớp học này, bạn có thể truy cập trang tài liệu chính thức Khi mô hình của bạn được tạo, bạn có thể áp dụng 6 trên đó>>> 1Bằng cách gọi 6, bạn có được biến 25, là một thể hiện của lớp 26. Đối tượng này chứa rất nhiều thông tin về mô hình hồi quyBước 4. Nhận kết quả Biến 25 đề cập đến đối tượng chứa thông tin chi tiết về kết quả hồi quy tuyến tính. Giải thích những kết quả này nằm ngoài phạm vi của hướng dẫn này, nhưng bạn sẽ tìm hiểu ở đây cách trích xuất chúngBạn có thể gọi 28 để lấy bảng kết quả hồi quy tuyến tính>>> 2Bảng này rất toàn diện. Bạn có thể tìm thấy nhiều giá trị thống kê liên quan đến hồi quy tuyến tính, bao gồm 𝑅², 𝑏₀, 𝑏₁ và 𝑏₂ Trong trường hợp cụ thể này, bạn có thể nhận được cảnh báo có nội dung 29. Điều này là do số lượng nhỏ các quan sát được cung cấp trong ví dụBạn có thể trích xuất bất kỳ giá trị nào từ bảng trên. Đây là một ví dụ >>> 3Đó là cách bạn có được một số kết quả của hồi quy tuyến tính
Bạn cũng có thể nhận thấy rằng những kết quả này giống hệt với kết quả thu được bằng scikit-learning cho cùng một vấn đề Để tìm thêm thông tin về kết quả hồi quy tuyến tính, vui lòng truy cập trang tài liệu chính thức Bước 5. Dự đoán phản hồi Bạn có thể nhận được phản hồi dự đoán về các giá trị đầu vào được sử dụng để tạo mô hình bằng cách sử dụng 33 hoặc 09 với mảng đầu vào làm đối số>>> 4Đây là phản hồi dự đoán cho đầu vào đã biết. Nếu bạn muốn dự đoán với các biến hồi quy mới, bạn cũng có thể áp dụng 09 với dữ liệu mới làm đối số>>> 5Bạn có thể nhận thấy rằng kết quả dự đoán giống như kết quả thu được với scikit-learning cho cùng một vấn đề Loại bỏ các quảng cáoNgoài hồi quy tuyến tínhHồi quy tuyến tính đôi khi không phù hợp, đặc biệt đối với các mô hình phi tuyến có độ phức tạp cao May mắn thay, có những kỹ thuật hồi quy khác phù hợp với những trường hợp hồi quy tuyến tính không hoạt động tốt. Một số trong số đó là máy vectơ hỗ trợ, cây quyết định, rừng ngẫu nhiên và mạng lưới thần kinh Có rất nhiều thư viện Python để hồi quy bằng các kỹ thuật này. Hầu hết chúng đều miễn phí và mã nguồn mở. Đó là một trong những lý do tại sao Python là một trong những ngôn ngữ lập trình chính cho máy học Gói scikit-learning cung cấp phương tiện để sử dụng các kỹ thuật hồi quy khác theo cách rất giống với những gì bạn đã thấy. Nó chứa các lớp dành cho máy vectơ hỗ trợ, cây quyết định, v.v., với các phương thức 6, 09, 4, v.v.Phần kết luậnBây giờ bạn đã biết hồi quy tuyến tính là gì và cách bạn có thể triển khai nó với Python và ba gói mã nguồn mở. NumPy, scikit-learning và mô hình thống kê. Bạn sử dụng NumPy để xử lý mảng. Hồi quy tuyến tính được thực hiện với những điều sau đây
Cả hai cách tiếp cận đều đáng để học cách sử dụng và khám phá thêm. Các liên kết trong bài viết này có thể rất hữu ích cho điều đó Trong hướng dẫn này, bạn đã học các bước sau để thực hiện hồi quy tuyến tính trong Python
Và với điều đó, bạn tốt để đi. Nếu bạn có câu hỏi hoặc ý kiến, xin vui lòng đặt chúng trong phần bình luận bên dưới Lấy bài kiểm tra. Kiểm tra kiến thức của bạn với bài kiểm tra tương tác “Hồi quy tuyến tính trong Python” của chúng tôi. Sau khi hoàn thành, bạn sẽ nhận được điểm số để có thể theo dõi quá trình học tập của mình theo thời gian Lấy bài kiểm tra " Đánh dấu là đã hoàn thành Xem ngay Hướng dẫn này có một khóa học video liên quan do nhóm Real Python tạo. Xem nó cùng với hướng dẫn bằng văn bản để hiểu sâu hơn. Bắt đầu với hồi quy tuyến tính trong Python 🐍 Thủ thuật Python 💌 Nhận một Thủ thuật Python ngắn và hấp dẫn được gửi đến hộp thư đến của bạn vài ngày một lần. Không có thư rác bao giờ. Hủy đăng ký bất cứ lúc nào. Được quản lý bởi nhóm Real Python Gửi cho tôi thủ thuật Python » Giới thiệu về Mirko Stojiljković Mirko có bằng tiến sĩ. D. trong Kỹ thuật cơ khí và làm việc như một giáo sư đại học. Anh là một Pythonista, người áp dụng các phương pháp tối ưu hóa kết hợp và máy học để hỗ trợ ra quyết định trong lĩnh vực năng lượng » Thông tin thêm về MirkoMỗi hướng dẫn tại Real Python được tạo bởi một nhóm các nhà phát triển để nó đáp ứng các tiêu chuẩn chất lượng cao của chúng tôi. Các thành viên trong nhóm đã làm việc trong hướng dẫn này là Aldren Geir Arne Joanna kate Kyle Bậc thầy Kỹ năng Python trong thế giới thực Với quyền truy cập không giới hạn vào Python thực Tham gia với chúng tôi và có quyền truy cập vào hàng nghìn hướng dẫn, khóa học video thực hành và cộng đồng các Pythonistas chuyên gia Nâng cao kỹ năng Python của bạn » Chuyên gia Kỹ năng Python trong thế giới thực Tham gia với chúng tôi và có quyền truy cập vào hàng ngàn hướng dẫn, khóa học video thực hành và cộng đồng Pythonistas chuyên gia Nâng cao kỹ năng Python của bạn » Bạn nghĩ sao? Đánh giá bài viết này Tweet Chia sẻ Chia sẻ EmailBài học số 1 hoặc điều yêu thích mà bạn đã học được là gì? Mẹo bình luận. Những nhận xét hữu ích nhất là những nhận xét được viết với mục đích học hỏi hoặc giúp đỡ các sinh viên khác. và nhận câu trả lời cho các câu hỏi phổ biến trong cổng thông tin hỗ trợ của chúng tôi Chúng ta có thể vẽ biểu đồ hồi quy tuyến tính nhiều lần trong Python không?Có thể triển khai nhiều mô hình hồi quy tuyến tính trong Python bằng cách sử dụng hàm mô hình thống kê OLS .
Làm cách nào để triển khai nhiều hồi quy tuyến tính từ đầu trong Python?Triển khai . bước 1. Nhập bộ dữ liệu (Nhà máy điện chu trình hỗn hợp). nhập numpy dưới dạng np. . # tách dữ liệuX = dữ liệu[. ,. 4] y = dữ liệu [. ,-1]. Xác định chi phí MSE. def cost_function(X, Y, B). m = len(Y). Tách tập huấn luyện và kiểm tra. m = 7000. f = 2X_train = X[. tôi,. f]. Khởi tạo các hệ số(β0, β1,…, Thư viện nào để nhập trong Python cho nhiều hồi quy tuyến tính *?Đang áp dụng mô hình
. scikit-learn library, there is no other library to implement multiple linear regression we do it with linear regression only. |