工学 >>> 控制科学与技术 >>> 自动控制理论 控制系统仿真技术 机电一体化技术 自动化仪器仪表与装置 机器人控制 自动化技术应用 自动控制技术其他学科
搜索结果: 151-165 共查到控制科学与技术 学习相关记录168条 . 查询时间(0.327 秒)
Abstract随着微电子机械系统(MEMS)的迅猛发展,自主式微直升机的研究也已成为这一领域内的研究热点之一.由于微直升机尺寸的限制,不能安装功能很强的传感器和处理器,难以获得完全的环境信息,所以传统的基于模型的控制方法不适用于环境是动态的自主微直升机控制.基于行为的控制方法采用累次逼近的方法,不需要环境的精确模型,因此系统的稳定性较好.本文采用基于替代传导径迹的增强式学习,结合即时差分方法,提...
基于适应策略的迭代学习调度          2007/12/13
Abstract适应调度是一种基于状态/性能反馈的定性控制方法.适应调度知识完成从状态到 调度规则的映射,与制造系统配置、生产任务构成、调度目标函数密切相关,并随调度问题 的改变而改变,具有较强的针对性.采用迭代学习方法,根据具体调度问题自动修正适应调 度知识,提高系统运行性能;另一方面,由于引入了调度目标函数,使生产管理者最关心的 性能得到优化,最大限度满足生产管理者的生产目标.仿真实验...
Abstract设计了一种新的学习控制律,它通过沿学 习轴递推辨识学习增益矩阵以改善控制效果,并分别针对连续系统及离散系统设计了学习控 制律,给出了相应的收敛性证明结果,同时考虑了系统存在噪声干扰及初始误差不为零时学 习控制器收敛性条件,最后把它用于气动伺服系统位置控制,给出了相应仿真结果,结果表 明本文提出的控制算法能达到很高控制精度.
本文针对具有往复特性的非线性运动控制,提出了一种基于Fourier无穷级数的无模型运动控制算法. 该算法将复杂的非线性问题映射成Fourier空间中若干个调节器问题. 从而简化了问题的求解.文中给出了算法收敛性的理论证明.最后在自行研制的小型运动平台上进行了相关实验,结果表明,该算法具有简单、高效、控制精度高等特点,有较强的实用性.
Abstract迭代学习控制(ILC)适合于具有某种重复运动(运行)性质的被控对象,可 实现有限时间区间上的完全跟踪任务.本文综述了迭代学习控制的基本内容和最新发展动态 ,对迭代学习控制的基本理论进行了分类研究,并讨论其存在的问题和发展趋势.
Abstract将强化学习算法与混合智能技术相结合,应用于船舶运动控制,克服了通常混合智 能算法的学习需要一定数量样本数据的缺陷,又能发挥各种智能算法的优势.仿真结果表明 在缺少样本数据情况下,该算法可以在一定程度上改进控制效果.
Abstract提出一种新的智能优化调度方法,将再励学习控制运用到电梯群控系统中,采用基于交通模式识别的小脑模型神经网络作为控制器,以乘客平均候梯时间最短为控制目标设计出电梯群控系统的控制方案.该控制方法不需要过多的专家知识及学习样本,可以实现在线学习并具有较强的自适应能力,提高了系统的效率并且使系统性能得到优化.以层间交通模式为例对系统进行仿真,结果证明了该方法的可行性及有效性.
Abstract针对线性时不变广义系统的迭代学习控制问题,利用时间加权范数性质,通过Frobenius范数给出广义系统在D型和PD型闭环学习律作用下系统的实际输出轨迹逐渐逼近理想输出轨迹的充分条件,并指出在D 型闭环学习律的基础上加上P 型闭环学习律不影响控制系统的收敛性,但可以改变系统的性能.仿真算例说明了该方法的有效性.
Abstract基于数据驱动机制的逆控制是一种非线性系统控制方法,关键问题在于局部逆控制模型的准确性,但尚无校验机制来保证其能否产生期望的输出.为此,提出一种k-VNN即时学习算法,提高了逆控制模型的建模精度.将该算法与性能指标优化策略相结合,在线修正逆控制模型预估的系统控制量,可得到系统的一步最优控制量,实现非线性系统的跟踪控制.为提高控制系统的泛化能力,提出一种数据库数据更新策略.仿真结果表明...
Abstract提出一种基于简化模型的DHP(Dual Heuristic Programming)方法的学习控制, 避免了标准DHP方法需要被控对象的精确模型来求得对于状态和控制动作的Jacobian矩阵,而是利用简化过程对象模型获得近似Jacobian矩阵,实现学习控制的需要.生化反应器定值控制的仿真结果表明, 该方法加快了学习过程,并对更大范围的参数变化具有鲁棒性.
Abstract在状态空间满足结构化条件的前提下,通过状态空间的维度划分直接将复杂的原始MDP问题递阶分解为一组简单的MDP或SMDP子问题,并在线对递阶结构进行完善.递阶结构中嵌入不同的再励学习方法可以形成不同的递阶学习.所提出的方法在具备递阶再励学习速度快,易于共享等优点的同时,降低了对先验知识的依赖程度,缓解了学习初期回报值稀少的问题.
Abstract针对发电机组的非线性、大范围运行等实际问题,研究了用于汽门系统的多模型自学习控制(MMSC).首先根据各种工况下的样本数据归纳出模糊控制规则;然后由模糊聚类算法将多种工况约简为典型工况,得到相应的子模型模糊控制(FLC).以子模型FLC 输出的加权集成作为MMSC 的控制输出,而加权系数取决于子模型匹配度.在子模型FLC 学习优化中,由支持向量机离线逼近模糊规则曲面,再由梯度下降算...
Abstract研究基于行为的移动机器人控制方法.将模糊神经网络与强化学习理论相合,构成模糊强化系统.它既可获取模糊规则的结论部分和模糊隶属度函数参数,也可解决连续状态空间和动作空间的强化学习问题.将残差算法用于神经网络的学习,保证了函数逼近的快速性和收敛性.将该系统的学习结果作为反应式自主机器人的行为控制器,有效地解决了复杂环境中的机器人导航问题.
Abstract设计了一个强化学习和仿真相结合的动态实时车间作业排序系统.首先引入多个随机变量,将车间作业排序问题转换成序贯决策问题;然后通过仿真手段构建车间作业排序问题的模型环境,求取系统性能指标并保证解的可行性;接着设计了一个多智能体Q-学习算法和仿真集成解决作业排序问题;最后通过仿真优化实验验证了该系统的有效性.
Abstract多机器人系统中,随着机器人数目的增加,系统中的冲突呈指数级增加,甚至出现死锁.本文提出了基于过程奖赏和优先扫除的强化学习算法作为多机器人系统的冲突消解策略.针对典型的多机器人可识别群体觅食任务,以计算机仿真为手段, 以收集的目标物数量为系统性能指标,以算法收敛时学习次数为学习速度指标, 进行仿真研究, 并与基于全局奖赏和Q学习算法等其他9种算法进行比较. 结果表明所提出的基于过程奖...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...