搜索结果: 1-15 共查到“知识库 工学 学习”相关记录926条 . 查询时间(0.134 秒)
一种基于随机权神经网络的类增量学习与记忆融合方法
连续学习 灾难性遗忘 随机权神经网络 再可塑性启发
2024/1/16
连续学习(Continual learning,CL)多个任务的能力对于通用人工智能的发展至关重要.现有人工神经网络(Artificial neural networks,ANNs)在单一任务上具有出色表现,但在开放环境中依次面对不同任务时非常容易发生灾难性遗忘现象,即联结主义模型在学习新任务时会迅速地忘记旧任务。
基于滚动时域强化学习的智能车辆侧向控制算法
滚动时域 强化学习 智能汽车 侧向控制
2024/1/16
针对智能车辆的高精度侧向控制问题,提出一种基于滚动时域强化学习(Receding horizon reinforcement learning,RHRL)的侧向控制方法.车辆的侧向控制量由前馈和反馈两部分构成,前馈控制量由参考路径的曲率以及动力学模型直接计算得出;而反馈控制量通过采用滚动时域强化学习算法求解最优跟踪控制问题得到。
近些年,联邦学习(Federated learning,FL)由于能够打破数据壁垒,实现孤岛数据价值变现,受到了工业界和学术界的广泛关注.然而,在实际工程应用中,联邦学习存在着数据隐私泄露和模型性能损失的问题.为此,首先对这两个问题进行数学描述与分析.然后,提出一种自适应模型聚合方案,该方案能够设定各参与者的Mini-batch值和自适应调整全局模型聚合间隔,旨在保证模型精度的同时,提高联邦学习训...
机械臂变长度误差跟踪迭代学习控制
迭代学习控制 误差跟踪 变迭代长度 机械臂
2024/1/16
针对任意初始状态下机械臂轨迹跟踪问题,提出一种变长度误差跟踪迭代学习控制(Iterative learning control,ILC)方法.首先,构造不依赖于期望轨迹的双曲余弦型期望误差轨迹,放宽经典迭代学习控制初始状态要求严格一致的条件.由于该误差轨迹只需设置一个常数项,因而能够有效减少计算量,使得期望误差轨迹的设计更为简单.其次,考虑机械臂运行区间随迭代次数变化的问题,构建虚拟误差变量补偿机...
异策略深度强化学习中的经验回放研究综述
深度强化学习 异策略 经验回放 人工智能
2024/1/16
作为一种不需要事先获得训练数据的机器学习方法,强化学习(Reinforcement learning,RL)在智能体与环境的不断交互过程中寻找最优策略,是解决序贯决策问题的一种重要方法.通过与深度学习(Deep learning,DL)结合,深度强化学习(Deep reinforcement learning,DRL)同时具备了强大的感知和决策能力,被广泛应用于多个领域来解决复杂的决策问题.异策略...
面向多智能体协作的注意力意图与交流学习方法
多智能体 强化学习 意图交流 注意力机制
2024/1/16
对于部分可观测环境下的多智能体交流协作任务,现有研究大多只利用了当前时刻的网络隐藏层信息,限制了信息的来源.研究如何使用团队奖励训练一组独立的策略以及如何提升独立策略的协同表现,提出多智能体注意力意图交流算法(Multi-agent attentional intention and communication,MAAIC),增加了意图信息模块来扩大交流信息的来源,并且改善了交流模式.将智能体历史...
针对机器人摄影测量中离线规划受初始位姿标定影响的问题,提出融合初始位姿估计的机器人摄影测量系统视点规划方法.首先构建基于YOLO(You only look once)的深度学习网络估计被测对象3D包围盒,利用PNP(Perspective-N-point)算法快速求解对象姿态;然后随机生成机器人无奇异无碰撞的视点,基于相机成像的2D-3D正逆性映射,根据深度原则计算每个视角下目标可见性矩阵;最后...
强化学习(Reinforcement learning,RL)在围棋、视频游戏、导航、推荐系统等领域均取得了巨大成功.然而,许多强化学习算法仍然无法直接移植到真实物理环境中.这是因为在模拟场景下智能体能以不断试错的方式与环境进行交互,从而学习最优策略.但考虑到安全因素,很多现实世界的应用则要求限制智能体的随机探索行为.因此,安全问题成为强化学习从模拟到现实的一个重要挑战.近年来,许多研究致力于开发...
基于外环速度补偿的封闭机器人确定学习控制
确定学习 速度补偿控制 神经网络 封闭机器人
2024/1/16
针对未开放力矩控制接口的一类封闭机器人系统,提出一种基于外环速度补偿的确定学习控制方案.该控制方案考虑机器人受到未知动力学影响,且具有未知内环比例积分(Proportional-integral,PI)速度控制器.首先,利用宽度径向基函数(Radial basis function,RBF)神经网络对封闭机器人的内部未知动态进行逼近,设计外环自适应神经网络速度控制指令.在实现封闭机器人稳定控制的基...
基于强化学习的减少烘丝过程中烟丝 “干头” 量的方法
烟丝含水率 过干烟丝 强化学习 超调
2024/1/16
针对烘丝开始阶段存在的烘丝温度超调、过干烟丝较多等问题,提出一种基于强化学习(Reinforcement learning,RL)的减少烟丝“干头”量的方法.该方法利用生产实时数据作为输入特征向量感知烘丝生产过程的状态变化,以烟丝含水率检测值为依据来评价、优化烘丝温度控制策略,实现对烘丝机温度设定值的在线修正,优化烘丝开始阶段的温度控制,有效改善烟丝过干问题。
基于低秩张量图学习的不完整多视角聚类
多视角聚类 视角缺失 不完整多视角聚类 图学习
2024/1/16
传统多视角聚类都基于视角完备假设,要求所有样本的视角信息完整,不能处理存在部分视角缺失情形下的不完整多视角聚类任务.为解决该问题,提出一种基于低秩张量图学习的不完整多视角聚类方法.为了恢复相似图中缺失视角所对应的样本关联信息,该方法将低秩张量图约束和视角内在图保持约束融入到多视角谱聚类模型。
双目深度估计的在线适应是一个有挑战性的问题,其要求模型能够在不断变化的目标场景中在线连续地自我调整并适应于当前环境.为处理该问题,提出一种新的在线元学习适应算法(Online meta-learning model with adaptation,OMLA),其贡献主要体现在两方面:首先引入在线特征对齐方法处理目标域和源域特征的分布偏差,以减少数据域转移的影响;然后利用在线元学习方法调整特征对齐过...
一种空间几何角度最大化的随机增量学习模型及应用
随机权神经网络 增量学习 空间几何角度最大化约束 无限逼近性
2024/1/16
针对随机权神经网络(Random weight neural networks,RWNNs)隐含层节点随机生成过程可解释性不足和节点随机生成而导致的网络结构不紧致等问题,提出了一种空间几何角度最大化随机增量学习模型(Stochastic incremental learning model with maximizing spatial geometry angle,SGA-SIM).首先,以空间...