工学 >>> 控制科学与技术 >>> 自动控制理论 控制系统仿真技术 机电一体化技术 自动化仪器仪表与装置 机器人控制 自动化技术应用 自动控制技术其他学科
搜索结果: 106-120 共查到控制科学与技术 学习相关记录168条 . 查询时间(0.596 秒)
Q学习算法是Watkins提出的求解信息不完全马尔可夫决策问题的一种强化学习 方法.这里提出了一种新的探索策略,并将该策略和Q学习算法有效结合来求解一类典型的 有连续状态和决策空间的库存控制问题.仿真表明,该方法所求解的控制策略和用值迭代法 在模型已知的情况下所求得的最优策略非常逼近,从而证实了Q学习算法在一些系统模型 未知的工程控制问题中的应用潜力.
大射电望远镜轨迹跟踪模糊学习控制.
对于一个未知的非线性连续系统或离散系统,从任给的一个初始控制出发,尝试实现一条 给定的输出目标轨线.在满足一定条件下,利用跟踪误差来修正控制函数,经过反复的迭代学 习可以取得满意的效果.本文改进了Arimoto、Togai和Bien等的开环迭代学习的收敛条 件,并提出闭环迭代学习算法.理论与仿真结果证明了闭环算法在收敛条件、速度和抗干扰能 力上都优于开环算法.
基于对常规机械手操作空间力/位置混合控制算法的简单回顾,及对该算法所遇到 困难的分析,提出了一种基于迭代学习的机械手操作空间力/位置混合控制算法,来改善机械 手同高刚度环境接触时,机械手力/位置混合控制的动态控制性能.给出了学习算法的收敛条 件及其证明.实验表明该算法具有快速的收敛性,能达到很高的力/位置动态控制精度.
基于神经网络的非线性学习控制研究.
将Q-learning从单智能体框架上扩展到非合作的多智能体框架上,建立了在一般和随 机对策框架下的多智能体理论框架和学习算法,提出了以Nash平衡点作为学习目标.给出了对 策结构的约束条件,并证明了在此约束条件下算法的收敛性,对多智能体系统的研究与应用有 重要意义.
在ASE/ACE模型中引入监督式学习的局部性网络作联想记机制,从而构造一种新 的自强式学习控制器模型RELCAM.仿真结果表明,使用该模型能显著改善学习和控制性能.
结合广义学习矢量量化神经网络的思想和信息论中的极大熵原理,提出了一种熵约束 广义学习矢量量化神经网络,利用梯度下降法导出其学习算法,该算法是软竞争格式的一种推 广.由于亏损因子和尺度函数被定义为同一个模糊隶属度函数,它可以有效地克服广义学习矢 量量化网络的模糊算法存在的问题.文中还给出熵约束广义学习矢量量化网络及其软竞争学习 算法的许多重要性质,以此为依据,讨论拉格朗日乘子的选取规则.
本文通过对位置伺服系统的学习控制的实验研究,提出系统滞后是学习控制过程发散的 主要原因.针对这一问题,文中提出了三种解决办法,即给定超前法、给定滤波法和给定超前 滤波法,并在实验中取得了满意的效果.
提出了一种CMAC(Cerebellar Model Articulatlon Controller)输入空间超闭球量化 方法.基于超闭球上模糊基函数的信息存储与恢复策略,还给出了快速收敛的学习算法.通过 非线性动态系统建模仿真研究,结果表明CMAC具有很强的学习记忆和泛化能力.
提出一种基于最小二乘的前向神经网络快速学习算法.与现有同类算法相比,该算 法无需任何矩阵求逆,计算量小,较适于需快速学习的系统辨识和其他应用.文中推导了算 法,并给出一种更为简便的局部化算法.系统辨识的仿真实例表明了算法的优良性能.
本文介绍了作者与合作者们研制成功的城市交通智能式实时控制系统(简称TICS)的硬 体结构框图,从交通工程学、计算机技术、系统结构和控制方式等角度分析了它的基本原理, 给出了包括主控回路和学习回路的控制原理框图,从交通状态推理和实时控制变量推理二个 方面介绍了它的推理机制,说明了它的学习机制,最后简述了对周期、相位差、绿信比的处理 原则.
针对一类未知动力学方程的单输入系统,采用插值的粗粒化Box Model进行学习控制. 与传统的Box Model及基于随机元胞自动机的控制模式比较,本模型设计思想自然,算法 简单.计算量小(常常小几个数量级),训练时间短,对三个较有代表性的实例的仿真结果 也是令人满意的.
遗传算法是应用比较广泛的一种随机优化算法.文中针对遗传算法在应用过程中出 现的收敛慢等问题提出一种优良模式自学习遗传算法,并且在理论上对算法的收敛性进行分 析.最后,通过多峰函数优化问题的仿真结果证明证了算法的实用性和有效性.
对具有滞后工业过程稳态优化进程提出加权超前局部对称双积分型迭代学习控制算 法.基于理想轨线与控制系统的实际输出动态信息,提出基本的迭代学习控制算法并分析和论证 算法的收敛性,给出局部对称积分区间参数的确定策略.数字仿真表明,加权超前局部对称双积 分型迭代学习控制算法能有效消除噪声对系统输出信号的影响并能改善滞后工业过程稳态优化 进程中控制系统的动态品质,如减少超调,缩短过渡时间,加快响应速...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...