Hồi quy logistic là gì? nguyên nhân hồi quy logistic lại quan tiền trọng? Hồi quy logistic tất cả những áp dụng nào? phân tích hồi quy chuyển động như cố gắng nào? mô hình hồi quy logistic hoạt động như thế nào? Làm thế nào để đối chiếu hồi quy logistic với những kỹ thuật ML khác? Làm cố kỉnh nào để bạn cũng có thể chạy phân tích hồi quy logistic trên AWS?

Hồi quy logistic là 1 kỹ thuật phân tích dữ liệu sử dụng toán học nhằm tìm ra quan hệ giữa nhì yếu tố dữ liệu. Sau đó, nghệ thuật này sử dụng mối quan hệ đã tra cứu được để dự đoán giá bán trị của rất nhiều yếu tố đó dựa trên yếu tố còn lại. Dự đoán thường tạo ra một số công dụng hữu hạn, như bao gồm hoặc không.

Bạn đang xem: Mô hình hồi quy logistic

Ví dụ: giả sử bạn muốn đoán coi khách truy vấn trang web của các bạn sẽ nhấp vào nút giao dịch trong giỏ hàng của mình hay không. So sánh hồi quy logistic cẩn thận hành vi của khách truy cập trước đây, chẳng hạn như thời gian dành cho trang website và con số các sản phẩm trong giỏ hàng. Quy trình phân tích này xác định rằng, trước đây, nếu như khách truy vấn dành hơn năm phút trên trang web và thêm hơn ba món đồ vào giỏ hàng, họ đang nhấp vào nút thanh toán. Nhờ vào thông tin này, sau đó, hàm hồi quy logistic có thể dự đoán hành vi của một khách mới truy cập trang web.


Tại sao hồi quy logistic lại quan tiền trọng?


Hồi quy logistic là 1 trong những kỹ thuật đặc trưng trong lĩnh vực trí tuệ nhân tạo và đồ vật học (AI/ML). Mô hình ML là các chương trình phần mềm có thể được giảng dạy để tiến hành các tác vụ cách xử lý dữ liệu phức hợp mà không yêu cầu sự can thiệp của con người. Quy mô ML được xây dựng bằng hồi quy logistic có thể giúp những tổ chức nhận được thông tin nâng cao hữu ích từ bỏ dữ liệu kinh doanh của mình. Họ có thể sử dụng mọi thông tin chuyên sâu này để phân tích dự đoán nhằm giảm ngân sách chi tiêu hoạt động, tăng độ công dụng và đổi chỉnh quy mô cấp tốc hơn. Ví dụ: doanh nghiệp rất có thể khám phá những mẫu hình cải thiện khả năng giữ lại chân nhân viên hoặc chế tác ra xây cất sản phẩm đem đến nhiều lợi nhuận hơn.

Dưới đây là một số lợi ích của việc áp dụng hồi quy logistic so với các kỹ thuật ML khác.

Tính đơn giản

Các quy mô hồi quy logistic ít phức tạp về phương diện toán học tập hơn các phương pháp ML khác. Bởi đó, bạn có thể triển khai chúng trong cả khi team ngũ của bạn không ai có chuyên môn sâu về ML.

Tốc độ

Các mô hình hồi quy logistic có thể xử lý cân nặng lớn tài liệu ở vận tốc cao do chúng đề nghị ít năng lực điện toán hơn, ví dụ điển hình như bộ nhớ và sức khỏe xử lý. Điều này khiến cho các quy mô hồi quy logistic trở nên lý tưởng đối với những tổ chức đang bắt đầu với những dự án ML để đạt được một trong những thành tựu nhanh chóng.

Sự linh hoạt

Bạn hoàn toàn có thể sử dụng hồi quy logistic nhằm tìm câu trả lời cho các câu hỏi có hai hoặc nhiều công dụng hữu hạn. Chúng ta có thể sử dụng phương thức này để giải pháp xử lý trước dữ liệu. Ví dụ: chúng ta cũng có thể sắp xếp dữ liệu với một phạm vi giá trị lớn, ví dụ điển hình như thanh toán giao dịch ngân hàng, thành một phạm vi quý hiếm hữu hạn, nhỏ tuổi hơn dựa vào hồi quy logistic. Sau đó, bạn cũng có thể xử lý tập dữ liệu bé dại hơn này với những kỹ thuật ML khác để phân tích đúng chuẩn hơn.

Khả năng hiển thị

Phân tích hồi quy logistic cung cấp cho nhà phát triển tài năng nhìn nhận các quy trình ứng dụng nội bộ rõ rộng so với các kỹ thuật phân tích tài liệu khác. Khắc chế sự nắm và sửa lỗi cũng trở thành dễ dàng rộng do các phép toán ít tinh vi hơn.


Hồi quy logistic có một số ứng dụng thực tế trong những ngành công nghiệp khác nhau.

Sản xuất

Các doanh nghiệp sản xuất vận dụng phân tích hồi quy logistic để cầu tính tỷ lệ xảy ra sự chũm ở thành phần trong đồ vật móc. Sau đó, họ đang lên lịch bảo trì dựa trên tỷ lệ đã cầu tính này để giảm thiểu sự cố trong tương lai.

Chăm sóc mức độ khỏe

Các nhà phân tích y khoa lên kế hoạch điều trị và âu yếm dự phòng bằng cách dự đoán kĩ năng mắc bệnh dịch ở bệnh dịch nhân. Họ thực hiện các mô hình hồi quy logistic để so sánh tác động của tiền sử mái ấm gia đình hoặc của bộ gen lên bệnh dịch tật.

Tài chủ yếu

Các doanh nghiệp tài chính phải phân tích các giao dịch tài chủ yếu để ngừa gian lận, xem xét các đơn xin vay mượn và đơn bảo hiểm để dự phòng rủi ro. Những vấn đề này cân xứng với mô hình hồi quy logistic vì chưng chúng có kết quả cụ thể, ví dụ điển hình như khủng hoảng cao hoặc khủng hoảng rủi ro thấp và ăn gian hoặc không gian lận.

Bộ phận Tiếp thị

Các khí cụ quảng cáo trực con đường sử dụng quy mô hồi quy logistic để tham dự đoán xem người tiêu dùng sẽ nhấp vào một quảng cáo giỏi không. Tác dụng là, những nhà tiếp thị hoàn toàn có thể phân tích bội phản ứng của fan dùng đối với những trường đoản cú ngữ với hình hình ảnh khác nhau, tạo thành các quảng cáo công suất cao có công dụng thu cháy khách hàng.


Hồi quy logistic là một trong trong số ít những kỹ thuật đối chiếu hồi quy khác biệt thường được những nhà khoa học tài liệu sử dụng trong trang bị học (ML). Để nắm rõ về hồi quy logistic, trước tiên chúng ta phải am hiểu thuật phân tích hồi quy cơ bản. Dưới đấy là một lấy một ví dụ về phân tích hồi quy đường tính để cho thấy cách thức hoạt động vui chơi của phân tích hồi quy.

Xác định câu hỏi

Bất kỳ quy trình phân tích dữ liệu nào cũng ban đầu bằng một thắc mắc kinh doanh. Đối cùng với hồi quy logistic, chúng ta nên giới hạn phạm vi thắc mắc để tất cả được tác dụng cụ thể:

mọi ngày mưa có tác động đến lợi nhuận hàng tháng của chúng ta không? (có hoặc không) quý khách hàng đang triển khai loại chuyển động thẻ tín dụng nào? (ủy quyền, ăn lận hoặc có tác dụng gian lận)

Thu thập dữ liệu lịch sử

Sau khi khẳng định câu hỏi, các bạn cần xác định các yếu ớt tố tài liệu có liên quan. Sau đó, các bạn sẽ thu thập dữ liệu trước đó cho tất cả các yếu tố. Ví dụ: để trả lời thắc mắc đầu tiên làm việc trên, chúng ta cũng có thể thu thập dữ liệu doanh thu hàng tháng với số ngày mưa từng tháng trong ba năm qua.

Đào tạo quy mô phân tích hồi quy

Bạn sẽ cách xử lý dữ liệu lịch sử bằng phần mềm hồi quy. Phần mềm sẽ xử lý các điểm dữ liệu không giống nhau và liên kết chúng theo cách thức toán học bằng phương pháp sử dụng phương trình. Ví dụ: ví như số ngày mưa gió trong cha tháng là 3, 5 và 8 còn doanh số trong số những tháng sẽ là 8, 12 với 18, thuật toán hồi quy đã kết nối những yếu tố này với phương trình:

Doanh số = 2*(Số ngày mưa) + 2

Dự đoán các giá trị không xác định

Đối với các giá trị không xác định, ứng dụng sẽ áp dụng phương trình để tham gia đoán. Nếu như bạn biết rằng mon 7 sẽ có sáu ngày mưa, phần mềm sẽ mong tính giá trị doanh số trong thời điểm tháng 7 là 14.


Để làm rõ về quy mô hồi quy logistic, trước tiên chúng ta phải hiểu các phương trình cùng biến.

Phương trình

Trong toán học, phương trình cho ta mối quan hệ giữa nhị biến: xy. Chúng ta có thể sử dụng những phương trình hoặc hàm này nhằm vẽ thứ thị theo trục x và trục y bằng cách nhập những giá trị khác nhau của xy. Ví dụ: nếu như khách hàng vẽ đồ thị mang đến hàm y = 2*x, các bạn sẽ có một con đường thẳng như hình dưới đây. Vì vậy hàm này còn gọi là hàm con đường tính.

*

Biến

Trong thống kê, biến hóa là các yếu tố tài liệu hoặc ở trong tính có giá trị khác nhau. Bất kỳ phân tích nào cũng có một số đổi thay nhất định là biến tự do hoặc thay đổi giải thích. Gần như thuộc tính này là lý do của một kết quả. Những biến khác là biến phụ thuộc vào hoặc biến hóa đáp ứng; quý giá của chúng dựa vào vào những biến độc lập. Chú ý chung, hồi quy logistic tò mò cách những biến độc lập tác động đến một trở thành phụ thuộc bằng phương pháp xem xét những giá trị dữ liệu lịch sử dân tộc của cả nhị biến.

Trong ví dụ sống trên của chúng tôi, x được điện thoại tư vấn là biến độc lập, biến dự đoán hoặc biến phân tích và lý giải vì nó gồm một cực hiếm đã xác định. Y được điện thoại tư vấn là trở nên phụ thuộc, biến kết quả hoặc biến đáp ứng nhu cầu vì giá bán trị của nó không xác định.

Hàm hồi quy logistic

Hồi quy logistic là một mô hình thống kê sử dụng hàm logistic, hay hàm logit vào toán học làm cho phương trình thân xy. Hàm logit ánh xạ y có tác dụng hàm sigmoid của x.

*

Nếu vẽ phương trình hồi quy logistic này, bạn sẽ có một con đường cong hình chữ S như hình bên dưới đây.

Xem thêm:

*

Như chúng ta cũng có thể thấy, hàm logit chỉ trả về các giá trị thân 0 cùng 1 cho biến phụ thuộc, dù quý hiếm của biến chủ quyền là gì. Đây là biện pháp hồi quy logistic ước tính quý hiếm của vươn lên là phụ thuộc. Phương thức hồi quy logistic cũng lập mô hình phương trình giữa nhiều biến độc lập và một trở thành phụ thuộc.

Phân tích hồi quy logistic với khá nhiều biến chủ quyền

Trong những trường hợp, nhiều biến đổi giải thích tác động đến quý hiếm của đổi thay phụ thuộc. Để lập quy mô các tập tài liệu đầu vào như vậy, bí quyết hồi quy logistic cần giả định mối quan hệ tuyến tính giữa các biến hòa bình khác nhau. Bạn có thể sửa thay đổi hàm sigmoid và đo lường và thống kê biến đầu ra sau cuối như sau

y = f(β0 + β1x1 + β2x2+… βnxn)

Ký hiệu β thay mặt cho thông số hồi quy. Quy mô logit rất có thể đảo ngược giám sát các giá trị thông số này khi bạn cho nó một tập tài liệu thực nghiệm đủ mập có những giá trị đã xác minh của cả hai biến nhờ vào và trở thành độc lập.

Log của tỷ số odds

Mô hình logit cũng hoàn toàn có thể xác định tỷ số thành công trên thua thảm hay log của tỷ số odds. Ví dụ: nếu như khách hàng đang chơi poker với bằng hữu và thắng bốn ván trên mười ván, tỷ số chiến thắng của các bạn là tư phần sáu, hoặc 4/6, và đó là tỷ số thành công xuất sắc trên thua trận của bạn. Khía cạnh khác, xác suất thắng là 4/10.

Về phương diện toán học, tỷ số odds về khía cạnh xác suất của người sử dụng là p/(1 - p) cùng log của tỷ số odds là log (p/(1 - p)). Chúng ta có thể biểu diễn hàm logistic bởi log của tỷ số odds như hình bên dưới đây:

*

Phân tích hồi quy logistic bao gồm loại nào?

Có ba cách tiếp cận so với hồi quy logistic dựa trên tác dụng của phát triển thành phụ thuộc.

Hồi quy logistic nhị phân

Hồi quy logistic nhị phân tương xứng với các vấn đề phân lớp nhị phân chỉ bao gồm hai kết quả có thể xảy ra. Biến dựa vào chỉ rất có thể có hai giá trị, chẳng hạn như có và không hoặc 0 với 1.

Dù hàm logistic tính toán một phạm vi giá trị giữa 0 và 1, quy mô hồi quy nhị phân vẫn sẽ có tác dụng tròn công dụng đến những giá trị ngay gần nhất. Nói chung, kết quả dưới 0,5 sẽ được làm tròn thành 0 và kết quả trên 0,5 sẽ được thiết kế tròn thành 1, vì thế hàm logistic trả về một hiệu quả nhị phân.

Hồi quy logistic nhiều thức

Hồi quy nhiều thức có thể phân tích những vấn đề có một trong những kết quả hoàn toàn có thể xảy ra, miễn sao số kết quả hữu hạn. Ví dụ: chuyên môn này hoàn toàn có thể dự đoán xem giá nhà đất sẽ tăng 25%, 50%, 75% hay 100% dựa trên dữ liệu dân số, nhưng sẽ không còn thể dự kiến được giá trị chính xác của một ngôi nhà.

Hồi quy logistic nhiều thức hoạt động bằng phương pháp ánh xạ các giá trị tác dụng cho các giá trị khác biệt giữa 0 cùng 1. Hàm logistic rất có thể trả về một khoảng dữ liệu liên tục như 0,1, 0,11, 0,12, v.v., vì vậy hồi quy nhiều thức cũng nhóm đầu ra đến những giá trị gần nhất có thể có.

Hồi quy logistic đồ vật tự

Hồi quy logistic sản phẩm công nghệ tự, hay mô hình logit gồm thứ tự, là 1 trong loại hồi quy đa thức quan trọng cho những vấn đề trong số đó các số thay mặt cho những bậc chứ không hẳn là giá trị thực tế. Ví dụ: các bạn sẽ sử dụng hồi quy vật dụng tự để dự đoán đáp án cho thắc mắc khảo gần kề yêu ước khách hàng review dịch vụ của công ty ở mức kém, ổn, giỏi hoặc xuất sắc dựa vào một cực hiếm số, chẳng hạn như số lượng mặt hàng họ mua từ bạn trong năm.


Hai kỹ thuật so với dữ liệu thịnh hành là so sánh hồi quy tuyến đường tính và học sâu.

Phân tích hồi quy tuyến tính

Như đã phân tích và lý giải ở trên, hồi quy con đường tính lập quy mô mối quan hệ giữa những biến dựa vào và hòa bình bằng tổ hợp tuyến tính. Phương trình hồi quy con đường tính là

y= β0X0 + β1X1 + β2X2+… βnXn+ ε, trong số đó β1 mang đến βn với ε là các hệ số hồi quy.

Hồi quy logistic so với hồi quy tuyến tính

Hồi quy tuyến tính dự kiến một biến dựa vào liên tục bởi một tập hợp những biến chủ quyền cho trước. Một trở nên liên tục hoàn toàn có thể có một phạm vi giá bán trị, chẳng hạn như túi tiền hoặc độ tuổi. Vì đó, hồi quy tuyến tính có thể dự đoán quý hiếm thực của phát triển thành phụ thuộc. Nghệ thuật này rất có thể trả lời các câu hỏi như "Giá gạo sau 10 năm nữa sẽ là bao nhiêu?"

Không hệt như hồi quy con đường tính, hồi quy logistic là một thuật toán phân loại. Kỹ thuật này không thể dự kiến giá trị thực sự cho dữ liệu liên tục. Kỹ thuật này hoàn toàn có thể trả lời các câu hỏi như "Liệu giá bán gạo trong 10 năm nữa có tăng 1/2 hay không?"

Deep learning

Học sâu thực hiện mạng nơ-ron hoặc những thành phần ứng dụng mô phỏng bộ não con fan để phân tích thông tin. Các phép toán học sâu dựa vào khái niệm toán học tập của vectơ.

Hồi quy logistic so với học sâu

Hồi quy logistic ít phức hợp và có cường độ điện toán thấp hơn so với học sâu. đặc biệt quan trọng hơn là nhà cải cách và phát triển không thể khảo sát hoặc sửa đổi các phép toán học tập sâu bởi vì tính chất phức tạp và dựa trên máy móc của chúng. Khía cạnh khác, các phép toán hồi quy logistic lại phân minh và dễ khắc phục sự cầm cố hơn.


Bạn có thể chạy hồi quy logistic bên trên AWS bởi Amazon Sage
Maker. Sage
Maker là một trong dịch vụ lắp thêm học (ML) được thống trị hoàn toàn, có các thuật toán tích hợp mang lại hồi quy tuyến tính và hồi quy logistic, trong số những gói ứng dụng thống kê khác.

phần đông nhà khoa học dữ liệu đều rất có thể sử dụng Sage
Maker để chuẩn bị, xây dựng, huấn luyện và giảng dạy và tiến hành các quy mô hồi quy logistic một phương pháp nhanh chóng. Sage
Maker loại trừ các công việc nặng nhọc của từng bước một trong quy trình hồi quy logistic sẽ giúp đỡ phát triển các mô hình rất chất lượng dễ dàng hơn. Sage
Maker cung cấp tất cả các thành phần cần phải có cho quy trình hồi quy logistic trong một bộ phương pháp duy nhất, giúp chúng ta cũng có thể sản xuất các quy mô nhanh hơn, thuận tiện hơn cùng tiết kiệm ngân sách chi tiêu hơn.

Bắt đầu áp dụng hồi quy logistic bằng cách tạo thông tin tài khoản AWS ngay lập tức hôm nay.

*

Ưu điểm của hồi quy logistic đối với hồi quy tuyến đường tính

Ưu điểm của hồi quy logistic so với hồi quy tuyến đường tính xuất xứ ở việc không đề xuất đo những giả định chung quan trọng trong so với hồi quy logistic. Hồi quy logistic không yêu cầu bất kỳ dạng phân phối rõ ràng nào của những biến hòa bình và những vấn đề như phương sai núm đổi. Rộng nữa, hồi quy logistic ko yêu cầu mối quan hệ tuyến tính giữa những biến tự do và các biến phụ thuộc cũng tương tự hồi quy tuyến tính. Cách thức này hoàn toàn có thể giải quyết các hiệu ứng phi tuyến đường tính ngay cả khi các số hạng mũ với đa thức ko được thêm vào trong 1 cách ví dụ dưới dạng những biến độc lập bổ sung vì quan hệ logistic. Cuối cùng, nó yên cầu sự chủ quyền của các quan sát.

Giả định của hồi quy nhị phân logit

Có một giả định ngầm định về hồi quy logistic đáng được để ý — độ đường tính của logit. Như là như bọn họ đã gồm trong hồi quy bội, mô hình logistic được biến hóa giả định mối quan hệ tuyến tính thân logit và những biến độc lập, đặc biệt là những biến hóa có đặc thù liên tục. Vào hồi quy bội, mối quan hệ phi tuyến tính ko được đề đạt trong hệ số hồi quy cùng thường yêu thương cầu những phép biến đổi hoặc đa thức polynomials để màn trình diễn tính phi tuyến. Giống như như vậy, hồi quy logistic tất cả thể gặp mặt phải các mối quan hệ giới tính phi tuyến làm giảm tài năng của những hệ số để đo lường và tính toán tác động rất đầy đủ của biến. Tuy nhiên, trong hồi quy logistic, việc khẳng định độ tuyến đường tính khó hơn đối với hồi quy bội vì các biểu đồ gia dụng phân tán scatterplots (biểu đồ vật phân tán của hai biến hoặc biểu đồ vật phân tán của phần dư) không hữu dụng cho việc xác định các điểm phi con đường tính tính trong những mối quan lại hệ.

Với quan hệ phi đường vốn bao gồm của hàm logistic, cách thức tốt nhất để bình chọn tính phi tuyến là gì? Kiểm tra đơn giản dễ dàng nhất là các bước Box – Tidwell áp dụng cho từng biến độc lập liên tục. Đầu tiên, hãy tạo ra một biến liên can interaction term là tích của biến độc lập và giá trị log của nó (biến độc lập * log (biến độc lập)). Sau đó, chất vấn mức ý nghĩa thống kê significant của biến liên hệ khi được sản xuất mô hình. Giả dụ nó có ý nghĩa sâu sắc thống kê thì chứng tỏ đó là yếu tố phi tuyến đường tính và vị đó rất cần phải giữ lại trong tế bào hình.

Tóm lại

Các trả định tốt nhất cơ bạn dạng trong phân tích hồi quy logistic liên quan đến tính hòa bình của các quan sát. Mặc dù nhiên, điều đặc biệt cần hãy nhớ là một giả định cơ bản là “độ tuyến đường tính của logit” tạo cửa hàng cho câu hỏi ước lượng mô hình logistic. Bởi sự thiếu hụt của những phương tiện đồ họa để khắc họa các điểm phi con đường tính, bài kiểm tra Box Tidwell là bí quyết tiếp cận thẳng nhất. Như sẽ đề cập ngơi nghỉ trên, điều này liên quan đến việc thêm đổi thay tương tác đại diện cho cảm giác phi tuyến của mỗi biến chủ quyền và sau đó reviews mức chân thành và ý nghĩa thống kê của nó. Việc kiểm tra những hiệu ứng phi tuyến sẽ tiến hành thực hiện sau thời điểm ước lượng mô hình để xem có nên thêm bất kỳ biến cùng / hoặc biến can hệ nào để nâng cấp sự cân xứng của mô hình hay không.

Hồi quy logistic là cách thức sử dụng cho những biến phụ thuộc hai nhóm (nhị phân) vì tính táo bạo mẽ, dễ phân tích và lý giải và chẩn đoán của nó.

Hồi quy logistic gồm các phương châm hữu ích tương đồng trong:

-Giải thích: cung ứng các mong tính về năng lực của một tập hợp các biến độc lập tập thể và riêng biệt để phân biệt giữa kết quả nhị phân.

-Phân loại: cung ứng một phương tiện đi lại để phân loại những trường thích hợp thành những nhóm hiệu quả và cung ứng một loạt các biện pháp chẩn đoán về độ đúng đắn dự đoán.

Hàm logistic là một phương tiện so với trực tiếp quan hệ phi con đường vốn bao gồm giữa tỷ lệ ước tính và công dụng nhị phân của 0 hoặc 1.