Regression Analysis là gì? Ý nghĩa, phân loại và ví dụ cụ thể
BÀI LIÊN QUAN
Anomaly detection là gì? Các ưu nhược điểm khi sử dụng anomaly detecrionTìm hiểu về ứng dụng của khai phá dữ liệu trong các lĩnh vựcHiểu rõ hơn về classification trong data miningRegression Analysis là gì?
Để giải đáp câu hỏi “Regression Analysis là gì?” chúng ta có thể hiểu đơn giản đây là một tập hợp các phương pháp thống kê dùng để ước tính các mối quan hệ giữa biến phụ thuộc và một hoặc nhiều biến độc lập. Trong đó, giá trị kỳ vọng của một hay nhiều biến ngẫu nhiên sẽ được dự đoán phụ thuộc vào điều kiện của các biến ngẫu nhiên khác đã được tính toán trước đó.
Regression Analysis cho phép đạt được kết quả ước lượng tốt nhất về mối quan hệ chân thực giữa các biến số. Từ phương trình ước lượng này, chúng ta có thể dự báo về biến phụ thuộc (chưa biết) dựa vào giá trị cho trước của biến độc lập (đã biết).
Phân tích hồi quy gồm một số biến thể như tuyến tính, nhiều tuyến tính và phi tuyến tính. Trong đó 2 mô hình phổ biến nhất là tuyến tính đơn giản và nhiều tuyến tính. Còn phân tích hồi quy phi tuyến thường được sử dụng cho các tập dữ liệu phức tạp hơn, các biến phụ thuộc và độc lập thể hiện mối quan hệ phi tuyến.
Ưu điểm và nhược điểm của Regression Analysis là gì?
Sau khi tìm hiểu Regression Analysis là gì, chúng tôi sẽ phân tích ưu điểm và hạn chế của phương pháp này để bạn đọc nắm rõ.
- Ưu điểm
- Có thể sử dụng số liệu trong quá khứ nghiên cứu để xác định và khoanh vùng phạm vi nghiên cứu
- Đây là phương pháp có độ chính xác cao nếu có nhiều mẫu nghiên cứu để phân tích
- Nhược điểm
Muốn có kết quả nghiên cứu chính xác và có độ tin cậy cao, phải có nhiều mẫu nghiên cứu nên điều này sẽ gây tốn kém chi phí và mất nhiều thời gian.
Phân loại Regression Analysis
Các nhà phân tích thường sử dụng số liệu quá khứ, đã diễn ra theo thời gian. Những dữ liệu đó có thể đã xảy ra tại cùng một thời điểm để thiết lập mối quan hệ giữa các sự kiện và hiện tượng có liên quan. Đây chính là một biểu hiện của phương pháp hồi quy.
Khi đó, người ta có thể giải thích diễn biến quá khứ đồng thời đưa ra các dẫn chứng để dự báo những sự kiện sắp xảy ra trong tương lai. Dựa trên nhiều tiêu chí thì Regression Analysis sẽ có sự phân loại khác nhau. Trong đó, có thể chia thành 2 dạng chính đó chính là:
Phương pháp hồi quy đơn
Phân tích hồi quy đơn (hồi quy đơn biến) là phương pháp được dùng để xem xét mối quan hệ giữa một chỉ tiêu phản ánh kết quả vận động của một hiện tượng kinh tế (biến phụ thuộc) với chỉ tiêu phản ánh nguyên nhân ( biến độc lập).
Phương trình hồi quy đơn có dạng: Y= a + bx
Trong đó:
- Y là biến phụ thuộc
- X là biến độc lập
- a là tung độ gốc (nút chặn trên đồ thị)
- b là hệ số góc (độ dốc hay độ nghiêng của đường biểu diễn Y trên đồ thị)
Mục đích của phương pháp này là giải thích hoặc dự báo một chỉ tiêu cần nghiên cứu, nên điều cần làm là phải tìm ra giá trị của a, b. Trên cơ sở đó, chúng ta xây dựng phương trình hồi quy tuyến tính để ước lượng các giá trị của Y ứng với mỗi giá trị của x.
Để xác định được giá trị của 2 thông số a và b, người ta sử dụng các phương pháp cực đại, cực tiểu, bình phương tối thiểu hoặc sử dụng phần mềm Excel trên máy tính.
Phương pháp hồi quy bội
Phương pháp hồi quy bội còn được biết đến là hồi quy đa biến. Đây là phương pháp được sử dụng để phân tích mối quan hệ giữa nhiều biến độc lập với một biến phụ thuộc (nhiều chỉ tiêu nguyên nhân với một chỉ tiêu kết quả).
Phương trình hồi quy đa biến tổng quát dưới dạng tuyến tính là: Y= b0 +b1x1 + b2x2 +… + bixi +… + bnxn + e
Trong đó:
- Y: biến phụ thuộc (chỉ tiêu phản ánh đối tượng nghiên cứu) và được hiểu là ước lượng (Y)
- b0: tung độ gốc
- bi: độ dốc của phương trình theo các biến xi
- xi: biến độc lập (nhân tố ảnh hưởng)
- e: sai số
Mục tiêu của phương pháp này là dựa vào các dữ liệu lịch sử về các biến Yi và Xi, dùng thuật toán để tìm các thông số b0 và bi, sau đó xây dựng phương trình hồi quy để dự báo cho ước lượng trung bình của biến Y. Phân tích hồi quy nhiều tuyến tính tuân theo các điều kiện tương tự như mô hình tuyến tính đơn giản, nhưng có nhiều biến độc lập được sử dụng trong mô hình.
Phân tích hồi quy vừa định lượng các quan hệ kinh tế, vừa kiểm định giả thiết về nhân tố tác động và mức độ ảnh hưởng. Từ đó làm tiền đề cho phân tích dự báo và đưa ra quyết định phù hợp, hiệu quả trong việc thực hiện mục tiêu mong muốn của các đối tượng.
Hiện nay, có rất nhiều mô hình sử dụng phân tích hồi quy đa biến như phân tích và dự báo doanh thu của tổ chức kinh doanh nhiều mặt hàng, phân tích tổng chi phí với nhiều nguyên nhân tác động,…
Ý nghĩa sử dụng Regression Analysis là gì?
Regression Analysis là kỹ thuật được sử dụng rộng rãi nhất trong khoa học xã hội. Không giống như các phương pháp trước đó, hồi quy là một ví dụ về phân tích sự phụ thuộc trong đó các biến không được xử lý đối xứng. Trong Regression Analysis, đối tượng là thu được một dự đoán của một biến với các giá trị của các biến khác.
Phương pháp hồi quy được sử dụng nhằm giúp chúng ta có thể ra được một đường sao cho phù hợp nhất và sát nhất thông qua những điểm dữ liệu đã thu thập được. Từ đó, chúng ta dễ dàng biểu diễn mối quan hệ giữa hai biến thu nhập và chỉ tiêu tiêu dùng thông qua các quan sát đó một cách đáng tin cậy nhất.
Ví dụ về Regression Analysis
Để có cái nhìn khách quan nhất cũng như nắm rõ Regression Analysis là gì, chúng tôi sẽ đưa ra ví dụ đơn giản nhất về phương trình tuyến tính hồi quy đơn với 1 biến độc lập và 1 biến phụ thuộc là thu nhập khả dụng và chi tiêu tiêu dùng. Yêu cầu vẽ đường phù hợp nhất với tập dữ liệu gồm các cặp kết quả quan sát về thu nhập (Y) và tiêu dùng (C).
Mục đích chúng ta phải tìm phương trình với điều kiện phù hợp nhất với các số đã thu thập được. Đường phù hợp nhất với dữ liệu phải được chọn sao cho giá trị của tổng bình phương của độ lệch dọc giữa các điểm và đường được giảm thiểu.
Phương pháp bình phương nhỏ nhất được ứng dụng trong hầu hết các Regression Analysis. Trong đó tính phù hợp của đường hồi quy với các kết quả quan sát mẫu được phản ánh bằng hệ số tương quan.
Đồ thị trong hình trên có thể được mô tả bằng một phương trình tuyến tính có dạng: C = C̅ + cY
Trong đó:
- c: hệ số của phương trình được ước tính dựa trên các quan sát đơn lẻ rút ra từ các tham số thực tế của dân số.
- C̅ và c: hệ số hồi quy qui có thể được ước tính thu được bằng phương pháp bình phương nhỏ nhất. Khi hằng số này có giá trị số sẽ được sử dụng để dự đoán giá trị của biến phụ thuộc C khi biết giá trị của biến độc lập Y.
Lời kết
Qua bài viết trên các bạn đã biết được Regression Analysis là gì chưa? Hy vọng một số kiến thức liên quan đến phân tích hồi quy sẽ giúp các bạn có được những thông tin thật sự bổ ích. Hãy luôn nhớ mục đích sử dụng của Regression Analysis để sử dụng thật chính xác bạn nhé!