通信資源調(diào)度對稱MARL問題策略估計誤差分析-2019年第02期-北京郵電大學學報-好發(fā)表

期刊在線咨詢服務，立即咨詢

400-838-9662 登錄/注冊購物車(0)

投稿策略

期刊推薦

雜志分類

首頁學術雜志科普訂閱 SCI期刊投稿經(jīng)驗文秘服務論著出書出版社

首頁 > 期刊 > 北京郵電大學學報 > 通信資源調(diào)度對稱MARL問題策略估計誤差分析【正文】

通信資源調(diào)度對稱MARL問題策略估計誤差分析

張昕然; 孫松林北京郵電大學信息與通信工程學院; 北京100876; 北京郵電大學可信分布式計算與服務教育部重點實驗室; 北京100876; 北京郵電大學移動互聯(lián)網(wǎng)安全技術國家工程實驗室; 北京100876

關鍵詞：強化學習對稱多智能體強化學習策略估計

摘要：針對通信資源調(diào)度場景下的多智能體強化學習(MARL)問題,提出了對稱MARL問題以及三類對稱性的定義和條件,并定義了策略融合和策略誤差;針對強對稱MARL問題,定義了三類評價指標,并對策略估計誤差進行分析,提出了強對稱MARL問題的策略誤差定理及推論.針對無線通信的接入控制問題建立了MARL問題,仿真結果驗證了強對稱MARL問題策略估計誤差的特性.結果表明,可以使用低復雜度的MARL子問題對高復雜度的強對稱MARL問題進行策略估計,且策略估計誤差和對網(wǎng)絡性能的影響均較小.

北京郵電大學學報雜志要求:

{1}請?zhí)貏e注意：著錄參考文獻出處時，期刊引文須注明的是引文所在具體頁碼，而非該文獻在期刊中的起訖頁碼；報紙引文必須在日期之后注明文獻所在的版次。

{2}稿件的作者署名、保密和是否侵權等問題均由作者自行負責。

{3}正文應論點明確、論據(jù)充分、文字簡煉、通順、層次清楚。

{4}結論之后，應有致謝部分，對國家科學基金、資助者或支持者、提供指導和幫助者、給予轉載和引用權的資料、圖片、文獻、研究思想和設想的所有者，表示感謝。

{5}關鍵詞每篇文章可選用3～5個能反映文章主題概念的詞、詞組或術語。

注：因版權方要求，不能公開全文，如需全文，請咨詢雜志社

投稿咨詢免費咨詢