答辯公告
論文題目 |
基于機器學習的時間序列預測關鍵技術及其應用研究 |
答辯人 |
曾攀 |
指導教師 |
金敏 |
答辯委員會 主席 |
陳浩 |
學科專業 |
軟件工程 |
學院 |
信息科學與工程學院 |
答辯地點 |
信科院5樓會議室 |
答辯時間 |
2020年11月25日 上午10:00 |
學位論文簡介
時間序列數據能夠客觀有效的反映客觀世界中不同現象和活動的變化過程,其背后蘊含了豐富的演變規律,準確的時間序列數據預測是實現優化資源配置、節能降耗、規避風險、優化決策等目標的基礎。隨著互聯網技術的發展,時間序列數據呈現迸發式增長,提高時間序列預測的預測精度和穩定性成為了一項極具挑戰性的任務,也是經濟和社會發展的迫切需求。為了提高時間序列預測方法的預測性能,本文針對時間序列預測中的關鍵性問題進行了深入研究,主要研究內容如下:
突破傳統時間序列預測方法在特征數據集構造方面的限制,從多個維度進行候選特征數據集的選取,從大量與預測目標數據具有相關性或者潛在相關性的數據中進行特征篩選,構造溯源特征數據集,旨在深入探尋導致時序數據波動變化的源頭并挖掘其變化機理,從而為預測模型提供全面、立體的特征數據支撐。
針對時間序列預測方法中,水平訓練數據集不能捕獲數據波動跨時段的變化趨勢以及垂直訓練數據集不能反應時序數據在短期內的波動模式,結合水平數據構造法和垂直數據構造法,提出構建交叉訓練集,從水平和垂直兩個方向進行訓練集的構建,綜合反映不同方向的數據波動規律?;诮徊嬗柧毤瘶嬙旖徊娑嗄P?,在二次學習的基礎上提出二次決策機制,利用決策多模型對預測多模型進行一次決策集成后,對決策多模型的多個輸出值進行二次決策集成,有效的提高了預測性能,解決了單決策模型應用范圍不廣、泛化能力不強的問題。
為了提高時間序列預測方法中多模型預測結果的集成精度,提出自適應權重分配策略對多模型的預測結果進行集成。該方法在去除預測值的幾個最值后,利用獨立驗證集對多模型中的獨立模型進行性能測試,據此對它們進行權重自適應分配,以各模型預測結果的加權和作為最終的集成結果。該方法具有對異常值和驗證集長度不敏感、預測精度高、穩定性強的優點。
提出基于溯源數據和交叉多模型的時間序列預測方法,特征數據集構造、訓練集選取、模型的構建和多模型結果集成四個方面的創新工作構成了該方法的主體框架,基于真實數據集的案例分析顯示所提出的方法相對其他先進方法具有更高的預測性能。
主要學術成果
Pan Zeng, Chang Sheng, Min Jin. A learning framework based on weighted knowledge transfer for holiday load forecasting. Journal of Modern Power Systems and Clean Energy, 2019, 7(2):329-339(SCI-2區,第一作者)
Pan Zeng, Min Jin, Md Fazla Elahe. Short-term Power Load Forecasting Based on Cross Multi-model and Second Decision Mechanism. IEEE Access,2020, 8:184061-184072(SCI-2區,第一作者)
Pan Zeng, Min Jin. Peak load forecasting based on multi-source data and day-to-day topological network. IET Generation, Transmission & Distribution, 2018, 12(6):1374-1381(SCI-3區,第一作者)
Pan Zeng, Di Wu, Min Jin. Compress-filtering and transfer-expanding of data set for short-term load forecasting[C]// International Joint Conference on Neural Networks. IEEE, 2017, 1095-1101(CCF-C類會議,第一作者)
Md Fazla Elahe, Min Jin, Pan Zeng. An Adaptive and Parallel Forecasting Strategy for Short-Term Power Load Based on Second Learning of Error Trend. IEEE Access,2020, 8: 201889-201899(SCI-2區,第三作者)
Bin Liu, Min Jin, Pan Zeng. Prioritization of candidate disease genes by combining topological similarity and semantic similarity. Journal of Biomedical Informatics, 2015, 57(C):1-5(SCI-3區,第三作者)