Luận văn: Nghiên cứu một số mô hình hồi quy và ứng dụng trong bài toán dự báo - Nguyễn Long Giang

Luận văn: Nghiên cứu một số mô hình hồi quy và ứng dụng trong bài toán dự báo - Nguyễn Long Giang

NỘI DUNG LUẬN VĂN

Luận văn gồm các chương

Chương 1. Tổng quan về hồi quy tuyến tính

Chương 2. Tổng quan về hồi quy phi tuyến tính

Chương 3. Đánh giá hiệu quả của mô hình hồi quy trên dữ liệu mẫu

Chương 4: Dự báo chỉ số CPI của Việt Nam

Kết luận

ppt 41 trang loandominic179 5230
Bạn đang xem 20 trang mẫu của tài liệu "Luận văn: Nghiên cứu một số mô hình hồi quy và ứng dụng trong bài toán dự báo - Nguyễn Long Giang", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
BỘ GIÁO DỤC VÀ ĐÀO TẠOTRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2TÊN LUẬN VĂN THẠC SĨ:NGHIÊN CỨU MỘT SỐ MÔ HÌNH HỒI QUY VÀ ỨNG DỤNG TRONG BÀI TOÁN DỰ BÁO GVHD: TS. Nguyễn Long GiangHọc viên: Nguyễn Thị Huân Mã số : 60.48.01.01 Hà Nội, tháng 12 năm 2017NỘI DUNG LUẬN VĂNLuận văn gồm các chươngChương 1. Tổng quan về hồi quy tuyến tính Chương 2. Tổng quan về hồi quy phi tuyến tínhChương 3. Đánh giá hiệu quả của mô hình hồi quy trên dữ liệu mẫuChương 4: Dự báo chỉ số CPI của Việt NamKết luậnLÝ DO CHỌN ĐỀ TÀIDự báo thống kê là một phương pháp thống kê được dùng để lượng hóa sự tiên đoán các nhân tố ảnh hưởng, các mối quan hệ nhân quả, các trạng thái hay quá trình mới, chiều hướng biến động của hiện tượng trên cơ sở phân tích thực trạng của đối tượng một cách khoa học. LÝ DO CHỌN ĐỀ TÀIHiện nay, có nhiều phương pháp dự báo khác nhau như dự báo bằng hệ chuyên gia, dự báo bằng phương trình hồi quy, dự báo bằng chuỗi thời gian Nhưng dự báo bằng phương pháp hồi quy tuyến tính được ứng dụng rộng rãi trong nhiều lĩnh vực nhất là kinh doanh và y học, nó có cơ sở khoa học rõ ràng và mang lại kết quả với độ chính xác cao. LÝ DO CHỌN ĐỀ TÀIMô hình hồi quy tuyến tính đưa ra các phương pháp ước lượng, kiểm định giả thiết và dự báoĐể hiểu rõ về các mô hình hồi quy và ứng dụng trong dự báo chuỗi thời gian, luận văn đã lựa chọn đề tài nghiên cứu, tiêu đề: “Nghiên cứu một số mô hình hồi quy và ứng dụng trong bài toán dự báo chuỗi thời gian”.Chương 1. TỔNG QUAN VỀ HỒI QUY TUYẾN TÍNH1.1. Giới thiệu về bài toán hồi quy1.2. Các mô hình hồi quy1.3. Các mô hình hồi quy tuyến tính1.4. Một số đặc tính của mô hình hồi quy tuyến tính1.5. Kết luậnChương 2. TỔNG QUAN VỀ HỒI QUY PHI TUYẾN TÍNH2.1. Hồi quy đa thức2.2. Mô hình hồi quy cộng thêm (GAMs)2.3. Vấn đề overfitting và regularization2.4. Kết luậnChương 3. ĐÁNH GIÁ HIỆU QUẢ CỦA MÔ HÌNH HỒI QUY TRÊN DỮ LIỆU MẪU3.1. Mục đích của thí nghiệm3.2. Thu thập dữ liệu3.3. Các tham số của thí nghiệm3.4. Công cụ và môi trường thử nghiệm3.5. Kết quả và nhận xét3.6. Kết luận MỤC ĐÍCH CỦA THÍ NGHIỆM Đề tài nghiên cứu của luận văn được tiến hành thí nghiệm với mục đích đánh giá hiệu quả của các mô hình, cụ thể là mô hình hồi quy tuyến tính đa biến, hồi quy ARIMA, mô hình hồi quy phi tuyến tính bao gồm hồi quy đa thức, hồi quy sử dụng hàm GAMs. Thông qua thí nghiệm đánh giá hiệu quả của từng phương pháp.THU THẬP DỮ LiỆULuận văn tiến hành thí nghiệm trên một số tập dữ liệu được thu thập với nhiều biến khác nhau bằng phương pháp thống kê.Đầu vào: Các file dữ liệu được thu thập từ trang web có địa chỉ Dữ liệu đầu vào là đa biến với các thuộc tính ở dạng số thực.CÁC THAM SỐ CỦA THÍ NGHIỆMBảng tạo các file thực nghiệm từ file dữ liệu thu thậpCÔNG CỤ VÀ MÔI TRƯỜNG THỬ NGHIỆM3.4.1. Công cụ thử nghiệm3.4.2. Môi trường thử nghiệm CÔNG CỤ THỬ NGHIỆMSử dụng ngôn ngữ R để thực hiện thử nghiệm.Giao diện làm việc trên ngôn ngữ RMÔI TRƯỜNG THỬ NGHIỆMMôi trường tiến hành thử nghiệm là máy tính cá nhân cài đặt hệ điều hành Windows 7 PCs có cấu hình bộ xử lý Intel(R) Core (TM) i3, CPU (2.66 GHz), 4.00GB of RAM. KẾT QUẢ VÀ NHẬN XÉT3.5.1. Kết quả sử dụng phương pháp hồi quy tuyến tính3.5.2. Kết quả sử dụng phương pháp hồi quy ARIMA 3.5.3. Kết quả thí nghiệm trên mô hình hồi quy đa thức3.5.4. Kết quả thí nghiệm trên mô hình hồi quy sử dụng hàm GAMs 3.5.5. Kết quả sai số của 4 phương phápKẾT QUẢ SAI SỐ CỦA BỐN PHƯƠNG PHÁPKẾT LUẬN3.6. Kết luậnChương này đã thực hiện thí nghiệm phân tích hiệu quả của các mô hình hồi quy trên các tập dữ liệu đa biến. Kết quả đã được trình bày rõ tại mục 3.5 và thấy rằng mỗi phương pháp hồi quy đều có các ưu và nhược điểm khác nhau, kết quả cho thấy phương pháp hồi quy sử dụng GAMs cho kết quả chính xác nhất với sai số và hệ số R2 là nhỏ nhất. Trong chương 4, luận văn sẽ trình bày những nghiên cứu tiếp theo trong việc ứng dụng các mô hình hồi quy vào giải quyết một bài toán trong thực tế. Chương 4. DỰ BÁO CHỈ SỐ CPI VIỆT NAM4.1. Tổng quan về dự báo chuỗi thời gian4.2. Bài toán dự báo chỉ số giá tiêu dùng CPI4.3. Xây dựng bài toán và các tham số của bài toán4.4. Công cụ và môi trường thử nghiệm.4.5. Mô hình dự báo và kết quảBÀI TOÁN DỰ BÁO CHỈ SỐ GIÁ TIÊU DÙNG CPIĐề tài nghiên cứu của luận văn căn cứ trên các chỉ số giá tiêu dùng đã được Tổng cục thống kê Việt Nam đưa ra trong 20 năm liên tục, từ năm 1997 đến năm 2017 làm cơ sở để thu thập dữ liệu cho bài toán. Luận văn sử dụng các mô hình hồi quy tuyến tính, hồi quy tuyến tính ARIMA, hồi quy đa thức, hồi quy cộng thêm GAMs dự báo chỉ số giá tiêu dùng cho tháng tiếp theo dựa trên chỉ số giá tiêu dùng của các tháng trước đó. XÂY DỤNG BÀI TOÁN VÀ CÁC THAM SỐ CỦA BÀI TOÁN4.3.1. Xây dựng bài toán4.3.2. Các tham số của bài toán XÂY DỤNG BÀI TOÁNTrong bài toán này tập trung sử dụng chuỗi thời gian trong quá khứ, dùng mô hình hồi quy để nhận dạng dữ liệu, ước lượng tham số, kiểm tra giá trị và dự báo. Áp dụng vào việc giải quyết bài toán dự báo chỉ số giá tiêu dùng (CPI) trong tương lai. Để giải quyết bài toán ta sử dụng mô hình hồi quy sau: CÁC THAM SỐ CỦA BÀI TOÁNTừ các dữ liệu thu thập được trong 240 tháng, đề tài nghiên cứu tiến hành xây dựng hai file dữ liệu như sau:- File CPI_training gồm 180 tháng là giá trị chỉ số CPI trong 15 năm từ năm 2002 đến năm 2016, - file CPI_testing gồm 132 tháng là giá trị chỉ số CPI trong 11 năm từ năm 1997-2006. - Mô hình dự báo sẽ được xây dựng trên file CPI_training và áp dụng mô hình cho file testing.CÁC THAM SỐ CỦA BÀI TOÁNCÁC THAM SỐ CỦA BÀI TOÁNCÁC THAM SỐ CỦA BÀI TOÁNĐầu ra của bài toán gồm:CÁC THAM SỐ CỦA BÀI TOÁNBảng tạo các file thực nghiệm từ file dữ liệu thực tế CPICÔNG CỤ VÀ MÔI TRƯỜNG THỬ NGHIỆM- Công cụ thử nghiệm là ngôn ngữ R .- Môi trường tiến hành thử nghiệm là máy tính cá nhânMÔ HÌNH DỰ BÁO VÀ KẾT QUẢ4.5.1. Kết quả ứng dụng mô hình hồi quy tuyến tính 4.5.2. Kết quả ứng dụng mô hình hồi quy tuyến tính ARIMA4.5.3. Kết quả ứng dụng mô hình hồi quy đa thức4.5.4. Kết quả ứng dụng mô hình hồi quy sử dụng GAMs 4.5.5. Kết quả sai số ứng dụng 4 mô hình hồi quyKẾT QUẢ ỨNG DỤNG MÔ HÌNH HỒI QUY TUYẾN TÍNH Mô hình dự báo hồi quy tuyến tính được xây dựng trên các file dữ liệu CPI được trình bày trong bảng Mô hình hồi quy tuyến tínhKẾT QUẢ ỨNG DỤNG MÔ HÌNH HỒI QUY TUYẾN TÍNH Bảng Kết quả phương pháp hồi quy tuyến tínhKẾT QUẢ ỨNG DỤNG MÔ HÌNH HỒI QUY TUYẾN TÍNH ARIMA Bảng kết quả phương pháp hồi quy tuyến tính ARIMAKẾT QUẢ ỨNG DỤNG MÔ HÌNH HỒI QUY ĐA THỨCBảng kết quả phương pháp hồi quy đa thứcKẾT QUẢ ỨNG DỤNG MÔ HÌNH HỒI QUY SỬ DỤNG HÀM GAMsBảng kết quả phương pháp hồi quy GAMsKẾT QUẢ SAI SỐ ỨNG DỤNG 4 MÔ HÌNH HỒI QUYBảng kết quả sai số của 4 phương pháp hồi quyKẾT LUẬN, KHUYẾN NGHỊ1. Kết luận2. Khuyến nghị KẾT LUẬN Qua quá trình thực hiện nghiên cứu đề tài của luận văn tôi đã cài đặt thử nghiệm thành công các mô hình hồi quy nghiên cứu (tuyến tính, tuyến tính ARIMA, đa thức, cộng thêm (GAMs)) trên các tập dữ liệu đa biến, đồng thời so sánh kết quả các phương pháp với nhau. Qua thực nghiệm, đã rút ra được rằng với mỗi phương pháp đều có các ưu, nhược điểm khác nhauKẾT LUẬN 	 và phù hợp với từng tập dữ liệu thống kê. Tuy nhiên, có thể nói rằng phương pháp hồi quy cộng thêm (GAMs) là hiệu quả hơn.Đã ứng dụng 4 phương pháp hồi quy vào bài toán thực tế - dự báo chuỗi thời gian, đó là dự đoán chỉ số giá tiêu dùng CPI của Việt Nam, kết quả mang lại hiệu quả tốt.KHUYẾN NGHỊ Mặc dù luận văn đã đạt được những mục tiêu đề ra nhưng vẫn còn một số điểm hạn chế sau:Thứ nhất, phạm vi ứng dụng của luận văn không rộng. Mặc dù luận văn nghiên cứu ứng dụng trên bài toán thực tế, nhưng còn ít chưa mở rộng sang các lĩnh vực khác như y học, xã hội học...KHUYẾN NGHỊThứ hai, do vấn đề về điều kiện và thời gian nghiên cứu nên dữ liệu phục vụ thực nghiệm chưa được phong phú và cỡ mẫu chưa lớn, kết quả thu được cũng chưa đánh giá đúng hết hiệu quả của các mô hình.KHUYẾN NGHỊ Để hoàn thiện nghiên cứu và tăng khả năng ứng dụng của đề tài này vào thực tiễn cần có những nghiên cứu bổ sung, mở rộng sang hướng thống kê các yếu tố ảnh hưởng đến chỉ số giá tiêu dùng như tỷ giá, giá cả các mặt hàng thiết yếu, mức cung ứng tiền tệ, mức dư cầu, như vậy mới có thể nâng cao được ý nghĩa thực tiễn của đề tài luận văn nghiên cứu.Xin trân trọng cảm ơn! 

Tài liệu đính kèm:

  • pptluan_van_nghien_cuu_mot_so_mo_hinh_hoi_quy_va_ung_dung_trong.ppt