Phân tích hồi quy là một kỹ thuật thống kê được sử dụng để ước lượng phương trình phù hợp nhất với các tập hợp kết quả quan sát được của biến phụ thuộc và biến độc lập. Nó cho phép bạn có được ước tính tốt nhất về mối quan hệ thực sự giữa các biến. Trong phương trình ước lượng này, biến phụ thuộc (chưa biết) có thể được dự đoán dựa trên một giá trị nhất định của biến độc lập (đã biết).
Hãy lấy ví dụ đơn giản nhất về một phương trình tuyến tính với một biến độc lập và một biến phụ thuộc, đó là thu nhập tiêu dùng và chi tiêu tiêu dùng. Vấn đề là vẽ một đường phù hợp nhất với tập dữ liệu bao gồm một cặp kết quả quan sát được về thu nhập (Y) và tiêu dùng (C).
Hình trên cho thấy một tập hợp các quan sát dưới dạng biểu đồ và chúng ta cần tìm phương trình của đường này phù hợp nhất với những con số chúng tôi thu thập được, bởi vì một đường như vậy sẽ cho kết quả dự đoán tốt nhất cho biến phụ thuộc. Đường phù hợp nhất với dữ liệu nên được chọn sao cho giá trị của tổng bình phương độ lệch dọc (khoảng cách) giữa các điểm và đường được giảm thiểu. Phương pháp bình phương nhỏ nhất thông thường này được sử dụng trong hầu hết các phân tích hồi quy. Sự phù hợp của đường hồi quy với các quan sát mẫu được phản ánh bởi hệ số tương quan.
Đồ thị trong hình trên có thể được mô tả bằng một phương trình tuyến tính có dạng:
C = C + cY
trong đó C¯ và c là các hệ số của phương trình – một ước tính dựa trên các quan sát đơn lẻ từ các tham số thực sự của tổng thể. Các hằng số C¯ và c thu được bằng phương pháp bình phương nhỏ nhất thông thường này được gọi là các hệ số hồi quy ước lượng. Khi chúng có các giá trị số, chúng được sử dụng để dự đoán giá trị của biến phụ thuộc C khi biết giá trị của biến độc lập Y.
Ví dụ: nếu ước lượng hệ số hồi quy của C¯ và c lần lượt là 500 và 0,7 thì phương trình hồi quy sẽ là C = 500 + 0,7Y và ta có thể kết luận rằng nếu thu nhập bằng 10.000 đồng thì chi tiêu cho tiêu dùng sẽ bằng . :
C = 500 + 0,7Y = 500 + 0,7 x 10000 = 7500
Hệ số hồi quy, phản ánh độ dốc c của đường hồi quy tuyến tính, có tầm quan trọng đặc biệt trong kinh tế học, vì nó cho biết sự thay đổi của biến phụ thuộc – trong trường hợp này là biến tiêu dùng, khi biến độc lập thay đổi một đơn vị. – đến trong trường hợp này. Ví dụ: giá trị của c bằng 0,7 cho biết người tiêu dùng sẽ chi 70% thu nhập tiện ích bổ sung cho tiêu dùng.
Khi giá trị của biến độc lập đã biết, phương trình hồi quy không dự đoán chính xác biến phụ thuộc. Lý do là các hệ số hồi quy ước lượng từ các quan sát mẫu chỉ là ước lượng tốt nhất cho các tham số tổng thể thực, vì vậy chúng phụ thuộc vào các biến ngẫu nhiên. Do đó, một phân phối có điều kiện có thể được xây dựng sao cho các giá trị có thể xảy ra của biến phụ thuộc C được dự đoán bằng phương trình hồi quy cho một giá trị nhất định của biến độc lập Y. Bình thường của phân phối có điều kiện này là biểu thị. ngưỡng mà tại đó chúng ta kỳ vọng tỷ lệ tiêu dùng sẽ giảm ở một mức thu nhập nhất định. Vấn đề này được phản ánh trong một thống kê được gọi là sai số chuẩn của ước tính—một đại lượng biểu thị các giới hạn ước tính mà chúng ta mong đợi C để lại cho Y và một định nghĩa nhất định. chắc chắn rằng Trong 95% trường hợp, với thu nhập 10.000 đồng, mức tiêu dùng thực tế sẽ nằm trong khoảng 7.500 – 500 đồng và 7.500 + 500 đồng.
Để thừa nhận sự không hoàn hảo của tất cả các phương trình hồi quy ước lượng từ mẫu trong việc xác định mối quan hệ thực sự trong tổng thể, phương trình hồi quy thường được viết là:
C = C¯ + cYd + e
nghĩa là, một biểu thức cho phần dư hoặc sai số được thêm vào để nắm bắt tác động cộng của biến thiên ngẫu nhiên và tác động của các biến độc lập khác, chẳng hạn như lãi suất tín dụng tiêu dùng—các yếu tố ảnh hưởng đến chi tiêu của người tiêu dùng nhưng không được chỉ định rõ ràng trong hồi quy phương trình.
Mọi người sử dụng hồi quy tuyến tính bội khi họ nghĩ rằng chỉ có một biến độc lập có ảnh hưởng mạnh đến biến phụ thuộc. Kỹ thuật này liên quan đến việc xây dựng một phương trình hồi quy bội với hai hoặc nhiều biến độc lập. Ai:
C = C + bY + di + e
Trong đó i là lãi suất của khoản vay tiêu dùng và d là số nhân bổ sung liên quan đến biến độc lập bổ sung i. Ước lượng bình phương nhỏ nhất thông thường của phương trình hồi quy bội phù hợp với biểu đồ ba chiều cho các quan sát mẫu và có thể được sử dụng để ước tính giá trị của ba hệ số trong phương trình trên: hồi quy C¯, c và d.
Nếu các mối quan hệ chính giữa các biến độc lập và biến phụ thuộc không tuyến tính (phi tuyến tính) thì không áp dụng được phương pháp hồi quy tuyến tính. Tuy nhiên, các mối quan hệ đường cong (phi tuyến tính) có thể được chuyển đổi thành mối quan hệ tuyến tính bằng cách sử dụng logarit tự nhiên của các biến, do đó làm cho chúng phù hợp với phân tích hồi quy tuyến tính.
(Tham khảo: Nguyễn Văn Ngọc, Từ điển Kinh tế, Đại học Kinh tế Quốc dân)