自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

思我所

见自己,见天地,见众生。

原创 Qt Creator常用快捷键及技巧

1.qtcreator中常用快捷键总结 2.Qt Creator 你必须要掌握的快捷操作

2020-02-29 18:03:56

阅读数 39

评论数 0

原创 随机优化和鲁棒优化的区别

随机优化(SO)和鲁棒优化(RO)实际上都是针对不确定情况的优化方法,从系数本身来说,SO需要知道或者预设一个该系数的概率分布,而RO需要知道这个系数的取值范围。从求解思路上来说,SO通常是限制失败的概率,即出现不确定系数的这个约束公式有X的概率成立,由于系数的概率分布已知,可以将这条约束转化成确...

2020-02-27 14:17:57

阅读数 288

评论数 0

原创 强化学习系列课程(二)马尔可夫决策过程

1. 马尔可夫过程 强化学习中,从初始状态到终止状态的序列过程被称为一个片段(episode)。下面举一个例子来说明状态转移矩阵的概念: 2. 马尔可夫奖励过程 马尔可夫奖励过程是状态转移矩阵是已知的,并且赋予了状态转移的奖励值。这里没有动作的概念,一切都是无法改变的,只能从一个旁观者的角度去看待...

2020-02-25 22:30:11

阅读数 44

评论数 0

原创 解决Ubuntu下无法挂载Windows下的硬盘的问题

1.打开终端:如果没有安装ntfs-3g就要安装: $ sudo apt-get install ntfs-3g 2.修复挂载错误的相应的分区如提示中的/dev/nvme0n1p5,输入: $ sudo ntfsfix /dev/nvme0n1p5 ...

2020-02-25 11:57:16

阅读数 35

评论数 0

原创 强化学习系列课程(一)强化学习概论

1. 整体结构 2. 奖励,动作、状态: 3. 策略 4. 值函数 5. 模型

2020-02-25 00:14:34

阅读数 105

评论数 0

原创 CSAIL实验室下的Robust Robotics Group的相关资料

Robust Robotics Group - 在决策理论规划,统计推断和人工智能方面的算法优化。 特别关注具有不确定模型的领域中的规划和控制问题,使用优化,统计估计和机器学习来从经验中学习良好的计划和策略。网址:Robust Robotics Group | CSAIL ...

2020-02-23 17:31:00

阅读数 43

评论数 0

提示
确定要删除当前文章?
取消 删除