序貫決策
[拼音]:xuguan juece
[外文]:sequential decision
用于隨機性或不確定性動態系統最優化的決策方法。序貫決策的特點是:
(1)所研究的系統是動態的,即系統所處的狀態與時間有關,可周期(或連續)地對它觀察;
(2)決策是序貫地進行的,即每個時刻根據所觀察到的狀態和以前狀態的記錄,從一組可行方案中選用一個最優方案(即作最優決策),使取決于狀態的某個目標函數取最優值(極大或極小值);
(3)系統下一步(或未來)可能出現的狀態是隨機的或不確定的。序貫決策的過程是:從初始狀態開始,每個時刻作出最優決策后,接著觀察下一步實際出現的狀態,即收集新的信息,然后再作出新的最優決策,反復進行直至最后。系統在每次作出決策后下一步可能出現的狀態是不能確切預知的,存在兩種情況:
(1)系統下一步可能出現的狀態的概率分布是已知的,可用客觀概率的條件分布來描述。對于這類系統的序貫決策研究得較完滿的是狀態轉移律具有無后效性的系統,相應的序貫決策稱為馬爾可夫決策過程,它是將馬爾可夫過程理論與決定性動態規劃相結合的產物。
(2)系統下一步可能出現的狀態的概率分布不知道,只能用主觀概率的條件分布來描述。用于這類系統的序貫決策屬于決策分析的內容。
建筑資質代辦咨詢熱線:13198516101
標簽:序貫決策
版權聲明:本文采用知識共享 署名4.0國際許可協議 [BY-NC-SA] 進行授權
文章名稱:《序貫決策》
文章鏈接:http://www.redeemerengisoft.com/14573.html
該作品系作者結合建筑標準規范、政府官網及互聯網相關知識整合。如若侵權請通過投訴通道提交信息,我們將按照規定及時處理。