您好,欢迎访问凯祺瑞科技有限公司网站!

收藏本站 | 在线留言 | 网站地图 | 切回到老版本

凯祺瑞凯祺瑞

开创梦想 立足巅峰 全国咨询热线

13530531768

最新热门关键词: 监控摄像头价格 | 监控摄像头安装 | 网络监控摄像头 | 监控摄像头品牌 | 工业监控摄像头 | 车载监控摄像头

工业监控摄像机价格
当前位置:首页 > 安防资讯> 监控资讯

蜂窝网络中D2D视频传输优化技术介绍

人气:发表时间:2018-6-15 15:14:38 【

目录:

1 优化目标

1.1 视频编码速率优化

1.2 无线资源分配与发射功率控制优化

1.3 最大化蜂窝网络的QoS

1.4 最大化视频用户的QoE

2 优化策略

(1) 集中式优化策略

(2) 分布式优化策略

(3)基于博弈论的分布式优化策略


概述:本文,阐述两个D2D视频传输架构的优化目标、优化参数和视频传输业务中QoS与QoE的基本概念;然后,总结性地概述了D2D视频传输优化技术中的两种经典的优化算法,即集中式与分布式策略;最后,叙述基于博弈论的分布式优化方法,以及斯塔克尔伯格博弈与非合作博弈等基础理论。

1 优化目标

本文研究蜂窝网络中Underlay型D2D视频传输场景。在这一场景中,本文研究的邻近和中继两种D2D视频传输架构的优化目标一致,即降低基站流量负载与网络信令开销,提高频谱利用率,最终实现改善视频接收端的用户体验质量。为达到上述优化目标,需要联合优化D2D发射机应用层、数据链路层和物理层的系统参数:邻近D2D视频传输架构中的优化参数包括应用层的视频编码速率、数据链路层的无线资源分配和物理层的发送功率控制;中继D2D视频传输架构中的优化参数除上述三个参数之外,还需要优化发射机与接收机之间的传输模式参数,即确定以中继转发还是直接D2D传输模式进行视频传输,下面具体介绍视频编码速率控制、无线资源分配、功率控制以及最大化视频用户QoE等参数的优化控制。

1.1 视频编码速率优化

随着移动视频业务需求的飞速增长,视频压缩编码技术也日益得到重视。速率控制是视频编码技术中最为关键的部分之一,视频编码速率控制策略的优劣与接收到视频的播放质量密切相关。在蜂窝网络中的D2D视频传输场景中,由于D2D视频发射机与接收机之间的信道带宽有限,为保证D2D接收机的视频播放质量,行之有效的方法是通过视频编码速率控制来调整视频编码的码流适应不同的D2D通信链路的信道条件。H.264是一个高度压缩的数字视频编解码器标准,允许以变数据速率传输,并可用数据速率来表示用户感知质量[36]。本文在表示视频用户体验质量模型部分将用到H.264标准中的相关技术。

1.2 无线资源分配与发射功率控制优化

本文是以支持D2D通信技术的LTE-A蜂窝网络为背景,所有蜂窝用户与D2D用户使用正交的频谱资源,其中无线资源在时频域上的最小分配单元是一个资源块(Resource Block, RB):每个RB占据一个时隙(即0.5毫秒),且包含12个连续的子载波,这些子载波之间的间隔为15KHz。因为蜂窝网络中的移动终端设备并不总是固定不动的,因此,网络中的信道状态信息是动态变化的,如何合理地分配无线资源块以提高频谱利用率、网络吞吐量等一直以来都是蜂窝网络中的一个重要优化目标,D2D通信的引入,使之更为关键。在Underlay型D2D通信中,D2D通信对可以选择复用上、下行频谱资源,但从干扰控制、系统复杂性和设计成本等角度,D2D通信应优先考虑使用上行资源。此外,当D2D通信以Underlay型资源复用方式与蜂窝通信共享上行频谱资源时,蜂窝通信的通信质量应首先被保证。

功率控制机制即控制每个资源块上的发射功率,其在蜂窝网络中的重要性体现在提高能源效率和控制干扰上。一般而言,功率控制机制可以与无线资源分配机制并用来优化蜂窝网络性能。在本文研究的Underlay型D2D视频传输场景中,保证蜂窝用户的通信质量是其他一切优化工作的前提,因此,控制D2D发射机的发射功率以控制D2D通信对蜂窝通信的干扰是本文中的一个及其重要的优化指标。

1.3 最大化蜂窝网络的QoS

网络服务质量(Quality of Service, QoS)设置的目标是实现一个更明确的网络行为以更好的传输网络中所承载的信息和利用网络资源,它表示网络为用户提供的服务的性能级别。网络或服务提供商可以向用户提供不同种类的服务,每种服务的质量可被一套预先设定的需求指标来衡量,这些指标称为QoS的关键性能指标,比如吞吐量、时延、误比特率等等。目前,在D2D视频传输优化技术的相关研究文献中,大部分研究者考虑以QoS为驱动的资源优化策略。然而对于D2D通信系统中的视频传输业务,优化网络QoS可能无法真正达到资源有效利用的目的。

1.4 最大化视频用户的QoE

本文研究的两个D2D通信系统的视频传输架构的最终优化目标都是为最大化蜂窝网络中的D2D视频接收端的体验质量(Quality of Experience, QoE)。QoE是用户在主观上对应用或服务的总体感觉和满意度[38]。与面向网络的QoS不同,面向QoS仅由诸如丢包率、时延和吞吐量等的技术中心度量来确定,面向用户的QoE基本上是对服务的评估用户的观点。事实上,网络中的QoS指标都达到时,可能也难以达到用户的QoE要求,例如,吞吐量最大化不能导致多媒体应用(例如视频和语音)的最佳用户感知质量,因为它们对数据速率、分组丢失和延迟的波动非常敏感。这主要是由于QoE还受到其他因素的影响,例如服务类型、参与统计的人数、视频长度等。这样的非网络相关因素可能不直接影响QoS,但确实影响QoE。QoS和QoE之间的关系成为QoE评估者的重要研究课题。

目前,在工业界与学术界对QoE的评估方法主要有主观与客观两种方式。其中,主观评估方法主要通过问卷调查或评分量表来测量用户的主观满意度。这种主观评估方法可能是最接近"地面实况"的QoE的方法,但是评估过程十分耗时且成本高昂。客观评价方法是使用不同的人类感知模型测量QoE,并自动近似QoE,而不需要人的参与。以这种方式,可以使用特定功能从QoS参数和其它媒体相关参数映射QoE。特别地,QoE的特征在于面向应用的平均意见得分(Mean Opinion Score,MOS),其反映了从差(1分)到优(5分)的用户满意程度[39]。当然,这种客观评估方法对于服务提供商是更切实可行的。因此,学术界针对移动视频业务提出了多种利用系统的客观参数评价用户主观感知质量(如QoE)的MOS模型[40,41]。从先前的研究成果可以看出,其中大部分与峰值信噪比(Peak Signal-Noise Ratio,PSNR)相关。



2 优化策略

根据研究现状,可以发现,D2D通信系统中的视频传输优化策略按优化模式可分为集中式和分布式两种。这两种策略的特征分别表述如下:

(1) 集中式优化策略

在这种模式中,通常是基站作为集中式调度器,为得到最优资源调度策略,需要获取蜂窝网络中所有的信道状态信息,求出最优资源调度策略后,还需要将决策结果反馈给小区中的用户,由用户执行。集中式调度模式虽然可以得到整个网络的最优资源分配策略,但由于网络中所有与决策相关的数据信息都由基站统一处理,这必然会给基站带来巨大的计算开销,且需要耗费网络中大量的信令资源。随着移动互联网的迅猛发展,下一代蜂窝网络中可能存在大量的蜂窝链路与D2D通信链路,若仍采用以基站为核心的集中式策略,集中式优化策略的不足会更加突出。此外,在支持D2D通信技术的LTE-A网络中,有的信道状态信息并不容易获取,如D2D设备之间的信道状态信息。更具体的,在利用D2D通信技术传输视频业务时,若要优化D2D发射机应用层的视频编码速率,则还需要将待传输视频的特征参数反馈给基站,这必然会进一步增加网络的信令开销,加重基站通信与计算负荷。

(2) 分布式优化策略

在此模式中,网络中的D2D终端直接通过D2D链路传输控制信令。D2D设备之间通过互发探测数据包来辅助执行调度决策。在整个调度过程中,基站不需要收集网络中所有的信道状态信息,只需要控制D2D通信与蜂窝通信之间因服用频谱资源而相互之间产生的干扰,比如D2D用户与蜂窝用户同时占用网络中的相同的频谱资源,基站仅需要控制D2D的发射机和与之占用相同子信道的蜂窝用户之间的干扰。D2D通信的资源占用与功率控制等具体的调度由D2D设备自己完成。因此,分布式优化策略可以大幅度降低基站的运算负荷,减少蜂窝网络中的信令开销。相比于集中式调度模式,它更适合于大用户数量的网络场景,其不足在于只包含部分信息,可以得到近似最优的调度决策,而不容易得到最优的调度决策。

(3)基于博弈论的分布式优化策略

从D2D视频传输的研究现状可以看出,目前在D2D视频传输优化方面,大部分文献采用的是集中式优化策略,很少采用分布式优化策略,尤其是在频带内Underlay型D2D视频传输优化技术的研究方面。在移动互联网的迅猛发展的背景下,未来分布式优化模式将会成为一种趋势。

博弈论作为运筹学中的一个重要分析工具,在资源分配方面已经得到了广泛的应用,通过合理的建模方式可以在保证所有用户利益均衡的同时极大地提升资源分配的有效性和公平性。近年来,博弈论在无线资源管理领域得到了广泛应用。本文基于博弈理论,分别针对邻近与支持中继传输的D2D通信系统中的视频传输架构,建立相应的数学博弈模型,并提出相应的分布式优化策略,达到上节内容阐述的跨层资源优化的目的。下面重点介绍基础博弈理论。

A、博弈论基础

博弈论(Game Theory)是分析具有竞争性质问题的数学理论和方法,主要研究具有理性思维能力的博弈者们之间冲突与协作的数学模型。日常人类活动中都蕴含着博弈的思想,但真正开始将它推向一种理论的是约翰 冯 诺依曼在1928年首先从理论的角度证实了博弈论的基本原理,极大程度上的推进了它的发展。1950年,约翰 纳什的毕业论文《Non-cooperation Game》的发表,为非合作博弈的发展奠定了基础。1980年之后,博弈论逐渐走向成熟,出现了大量的研究成果,1994年到2012年间,博弈论研究领域产生了六个诺贝尔经济学奖。目前,博弈论在经济学、计算机科学以及无线通信等领域中被普遍应用。为便于说明博弈论,下面首先介绍博弈论中几个重要的概念。

1)局中人(Player):又称为决策主体或参与者,指具有理性思维和独立行为决策能力的团体、组织或个人等。以自身的效用(如,利益)驱动策略的选择,实现最大化自己的效用。

2)行动(Action):指在博弈的某个时间节点,局中人为增加自己的效用而选择的策略。

3)行动顺序(Orders):指局中人选择策略前后次序。因为局中人并不一定都会同时进行策略选择,并且决策前与后可能会关系到博弈的结果。

4)策略集(Strategy set):又叫策略空间,表示局中人能够选择的策略的集合。

5)效用(Utility):指博弈中的每个局中人因执行选择的策略而获取的收益,收益的大小可以用数值表示。在博弈过程中,每个局中人的效用,不只与自己的决策有关,还与所有其他局中人的决策有关。

6)信息(Information):指关于自然的选择以及其他局中人的效用与行动等知识。根据其特征衍生出"完美信息"与"共同知识",前者是指一个局中人选择策略前准确知道其他局中人的行为。共同知识又称为完全信息,指博弈中的局中人都清楚知道其他的局中人选择的策略与效用函数。

7)均衡(Equilibrium):是一种策略组合,其中每个策略是当前条件下最佳策略。达到均衡状态后,每一个局中人都愿意维持现状。

博弈模型的主要三种分类方式总结为:第一,根据局中人的行动是否是顺序的,分为静态动态博弈。其中静态博弈表示所有局中人是同一时间采取行动或是与之有相同效果的博弈,例如行动的时间是不同,后行动的不知道先行动的信息;而动态博弈表示在那些行动具有有先后性的博弈中,后行动的可以掌握先行动的信息,并根据掌握的信息再采取行动;第二,根据局中人之间是否存在合作关系的,分为合作和非合作博弈。其中合作博弈是指局中人共享信息,通过合作至少提高一个局中人的收益而不损害其他局中人的收益,又被称为正和博弈;非合作博弈是指局中人互不合作,但利益相互影响,在这种情况下局中人独立自主地进行决策以使效用最大;第三,根据信息是否是完全并且准确的,分为完全信息和非完全信息博弈,其中完全信息博弈是指局中人完全且准确地掌握别的局中人的信息,比如效用、策略集等等,若掌握的信息不够准确或不够完全则是不完全信息博弈。以上几种博弈根据其特征相互组合又可以构成新的博弈类型,如完全信息动态博弈。

下面,以囚徒困境为例子对上述概念进行说明。囚徒困境的模型为:两个犯罪嫌疑人甲和乙被捕,由于证据不足,若其中一人或两人坦白罪行,就能定罪。因此,警察将它们分别关在不同的牢房里,互相隔离不能互通消息。并通知甲和乙:两人只有沉默和坦白两种选择,如果任一方坦白,则被判关押6年;若其中一个沉默而另一个选择坦白,则坦白的被判释放出狱,选择沉默的将关押9年。甲和乙也知道大家都选择沉默,那么警局会因为证据不足,只能关押他们一年。

在囚徒困境中,局中人集合表示为{甲,乙};甲和乙的策略集合表示为{坦白,沉默};囚徒甲的效用函数:坦白的效用(-6,0),沉默的效用(-9,-1)。如表2-1所示,囚徒乙与甲的效用矩阵是对称的,因此,囚徒乙的效用函数与囚徒甲的一样。从表2-1中的效用矩阵分析,对于任意一个,选择"坦白"都比选择"沉默"具有更高的效用。因为博弈双方清楚知道对方的效用函数与策略集等信息,因此属于完全信息博弈。另外,不管甲和乙是否同时行动,双方都不能清除知道对方的决策,因此它又属于静态博弈。综合以上两类,也属于完全信息静态博弈。

B、博弈论中的均衡

上一节中已经给出了均衡的基本概念。结合本文研究的博弈类型,本节重点介绍纳什均衡与子博弈精炼纳什均衡的相关基础。

(1) 纳什均衡

1950年,约翰 纳什在他的一篇论文中首先提出了纳什均衡(Nash Equilibrium, NE)的定义,并证明其广泛存在于有限非合作博弈中,表明博弈过程中可以找到一个有价值的结果。纳什均衡的具体含义可以表述为:在包含两个或者更多局中人的非合作博弈中,其他的局中人不改变他们所选择的策略的情况下,没有哪个局中人可以用更改其自身的策略的方式而提高效用的,从而所有局中人都不会改变其策略,整个博弈进入一个稳定的状态,此状态下的策略集合与效用即为纳什均衡。标准形式的纳什均衡定义如下。

定义2.2:一个局中人集合为P={1,2, ,N}的博弈G={S1, S2, , SN ; U1, U2, , UN},其中Sn和Un分别表示局中人n的策略空间和的效用函数, 。则所有局中人决策形成的策略组合的集合可以表示为 ,对于其中任意一个策略组合 ,所有局中人的效用函数值构成的集合表示为 ,其中 表示居中人n在策略组合 下的效用。令 表示局中人n选择的策略, 表示除局中人n之外的其他局中人选择的策略组合, = 。若s* 为纳什均衡,则下式成立:

(2-1)

当对于所有局中人上述不等式严格成立时(即" "被">"替代),则为严格纳什均衡。若式子(2-1)只对部分局中人严格成立,那么为弱纳什均衡。

继续以囚徒困境为例,效用矩阵所示,如果囚徒甲和乙是理性的,不管对方选择哪种策略,都会选择坦白。以囚徒甲为例,假设甲的决策是沉默,则若乙的决策也是沉默,甲的效用是-1;若乙的决策是坦白,甲的效用是-9;而甲的决策是坦白时,则若乙的决策是沉默,甲的效用是0(大于-1);若乙的决策是坦白,则甲的效用是-6(大于-9)。因此,在囚徒困境中,策略组合(坦白,坦白)是纳什均衡,而其他组合,如(坦白,沉默)、(沉默,沉默)、(沉默,坦白)都不是纳什均衡。其实进一步分析,可以发现策略组合(坦白,坦白)还是占优策略均衡,因为对于甲和乙而言,坦白都是占优策略。

(2) 子博弈精炼纳什均衡

子博弈精炼纳什均衡(Subgame Perfect Nash Equilibrium, SPNE)是基于原纳什均衡的改进。1965年莱茵哈德 泽尔腾首先提出了子博弈精炼纳什均衡的概念,其目的是除去均衡中的那些不可置信的威胁战略,研究完全信息动态博弈的结果。根据完全信息动态博弈的特点,局中人的行动是有先后顺序的,一方面后行动的策略选择会参考先行动者选择的策略;另一方面,先行动的知道后行动者会依赖于本身的影响,因而在选择策略时,也会考虑自己选择的策略对后行动者策略选择的影响。子博弈精炼纳什均衡为研究完全信息动态博弈的合理解。

其中子博弈是一个独立的博弈,属于原博弈的一个子部分。根据文献,子博弈的定义表述如下:一个扩展式表述的博弈 的子博弈是由一个决策结以及该结的后续结构成,子博弈满足以下两个条件:

1)是从一个单结信息集开始;

2)子博弈的信息集与效用向量都继承于博弈 。

根据文献与子博弈的概念,下面给出子博弈精炼纳什均衡的定义:

定义:扩展式表述N个局中人的博弈G的策略组合 是一个子博弈精炼纳什均衡的条件:

1)它是原博弈的纳什均衡;

2)它在每一个子博弈上也是纳什均衡,其中 表示局中人i的最优策略。

为进一步说明子博弈精炼纳什均衡,以扩展式表述的博弈为例。博弈中含有两个局中人,假设局中人1先决策,局中人2先观察局中人1的决策,然后根据1的决策选择自己的策略。局中人1只有一个信息集,策略空间为{L,R}。局中人2有两个信息集,有四个纯策略,分别为:不管局中人1选择什么策略,我都选择K;局中人1选择策略L,我选择策略K,局中人1选择R,我选择U;局中人1选择策略L,我选择策略U,局中人1选择策略R,我选择策略K;不管局中人选择什么策略,我都选择策略U。这四个纯策略从左至右,可以简写为:{K,K},{K,U},{U,K},{U,U}。从表2-2子博弈精炼纳什均衡例子的效用矩阵展示的效用矩阵,可以得到原博弈有两个纳什均衡:(L,{U,U})与(R,{U,K})。

(a)原博弈 (b) 子博弈I (c) 子博弈II

(b)和(c)是原博弈(a)的两个子博弈。在子博弈I中,局中人2的最优策略是U;在子博弈II中,局中人2的最优策略是K。根据定义2.3,原博弈纳什均衡(L,{U,U})中局中人2的均衡策略{U,U}是子博弈I的纳什均衡,但不是子博弈II的纳什均衡,不满足定义的第二个条件。因此,(L,{U,U})不是子博弈精炼纳什均衡。而纳什均衡(R,{U,K})中的均衡策略{U,K}既是子博弈I也是子博弈II的纳什均衡,即当局中人1选择策略L时,局中人2选择U;当局中人1选择策略R时,局中人2选择K。因此,此博弈的子博弈精炼纳什均衡为(R,{U,K})。

局中人1局中人2{K,K}{K,U}{U,U}{U,K}

L(3,1)(3,1)(1,3)(1,3)

R(2,1)(0,0)(0,0)(2,1)

C、斯塔克尔伯格博弈模型

斯塔克尔伯格博弈模型是经济学领域中的一种经典的策略博弈模型,出自德国经济学家冯 斯塔克尔伯格1934年出版的《市场结构与均衡》一书。斯塔克尔柏格模型是经济学中的双寡头模型之一,属于完全信息动态博弈[44]。在双寡头斯塔克尔伯格博弈案例中,局中人是两个关系为主从关系的寡头生产厂商,为最大化自己的收益,他们对生产产品数量进行竞争。位于主导地位的被称为主导者,另一个被称为跟随者,主导者先行动对生产数量进行选择,跟随者先观察主导者的决策然后再选择自己的生产数量。在博弈过程中,主导者虽然不知道追随者的具体的决策,但知道追随者肯定会依据自己的决策而选择策略,因此,在选择行动时会考虑它的影响。另外,先行动者必须遵循一旦行动,就行动到底,不能再撤回的原则。因上述双寡头模型的局中人数量只有两个,这种问题又被称为两级斯塔克尔伯格博弈问题。但在实际问题,大部分的斯塔克尔伯格博弈问题中局中人的数量一般超过两个,例如一个主导者,两个或两个以上的跟随者,这种问题被称为多级斯塔克尔伯格博弈问题。

斯塔克尔伯格博弈的主要特点可以总结为如下几点:1)属于完全信息动态博弈,它的均衡结果是子博弈精炼纳什均衡(SPNE);2)是一种主从递阶层次结构,主导者与追随者的地位不一样,主导者的权力较大,其效用函数一般具有一定的全局性;3)主导者与追随者之间、追随者与追随者之间相互制约相互影响,主导者虽然先行动,但为得到最大效用,在确定自己的策略前必须考虑到追随者根据他的策略会作出怎样的决策,追随者清楚知道主导者的决策并根据它来确定自己的策略,这种关系在一定程度上互相限制了对方的策略集。

下面,本文以两级斯塔克尔伯格博弈模型为例对此进行说明。局中人集合P={1,2},其中1与2分别表示主导与跟随厂商。用 与 分别来表示局中人i选择的产量与成本函数( ),用F表示价格函数,则局中人i的效用函数可以表示为 , 。此模型可利用逆向归纳法求解子博弈精炼纳什均衡,主导者在做确定自己的策略之前首先会考虑对于自己所选择的策略,追随者做出的最佳策略会是什么。然后主导者选择自己效益最大的厂量,在博弈中假设每个局中人都是理智的,追随者根据主导者的厂量选择自己收益最大的厂量。因为是逆向求解,因此,给定 最大化追随者的效用值。对函数 求关于 的一阶导数,可得到:

(2-2)

在这里假设价格函数为线性函数,即 ,其中a与b为常数。代入上式并令求导结果等于0求效用函数的极大值,则可得 关于 的表示式

(2-3)

将上式表示 的表示式代入主导者的效用函数中,并对 求导得到:

(2-4)

令以上一阶求导结果等于0,即可得到主导者的最优行动:

(2-5)

上述表示式是主导者对均衡中追随者决策的最优决策。追随者知道主导者的决策 之后,自己的最优策略可以通过将 代入式(2-2)中得到,即:

(2-6)

由式(2-4)与(2-5)可以得到两级斯塔克尔伯格博弈例子的子博弈精炼纳什均衡解为 。

多级斯塔克尔伯格博弈模型与求解两级博弈模型的子博弈精炼纳什均衡的思想类似。在一个主导者、多个跟随者的斯塔克尔伯格博弈模型中,主导者先预期所有追随者的反应并根据这些信息选择自己的策略。追随者为最大化自己的效用,根据主导者的决策信息互相博弈选择一个最优策略,若追随者们是非合作的,那么根据主导者的选择的策略信息,追随者们通过非合作博弈达到纳什均衡。主导者根据追随者的反馈信息,重新进行决策,然后追随者们根据主导者的新决策重新进行非合作博弈,如此开始新的一轮博弈,最终达到子博弈精炼纳什均衡。

在频带内Underlay型的D2D通信系统中,如何有效地引导D2D通信用户复用哪些频谱资源,以保证网络中蜂窝用户的通信质量是重要的。因此,本文引入斯塔克尔伯格博弈模型,令基站作为主导者,先行动,设置网络中的干扰功率价格以引导D2D通信用户对频谱资源的复用,控制网络中的干扰;D2D通信用户作为追随者后行动,根据干扰功率价格以非合作博弈的形式竞争占用频谱资源以最大化自己的效用。本文基于这种由基站引导,D2D通信用户独立自主占用蜂窝资源的特征,建立相应的斯塔克尔伯格博弈模型,然后针对此模型提出一种分布式调度算法求解其中的斯塔克尔伯格均衡。

文章由凯祺瑞科技整理发布,转载请注明出处:http://www.kqafzn.com/content/?1146.html


监控摄像头系统推荐

最热监控文章排行榜

最新监控文章排行榜

客服中心

点击这里给我发消息 智能客服

点击这里给我发消息 客服1


客户服务热线

13530531768

展开客服