Home

课程大纲 Lecture 1: Overview(课程概括与RL基础) Lecture 2: Markov Decision Process(马尔科夫决策过程)) Lecture 3: Model-free Prediction and Control(无模型的预测和控制) Lecture 4: On-policy and Off-policy Learning() Lecture 5: Value Function Approximation(价值函数近似) Lecture 6: Policy Optimization: Foundation(策略优化基础) Lecture 7: Policy Optimization: State of the Ar...

研究起因在「字节范儿」一期公众号推送《我走过最迷的路，是字节跳动程序员的脑回路》上看到这样一个段子：想起来我也曾经不止一次在等电梯的时候思考过这个问题，因此这次决定好好研究下这个调度算法。传统算法熟练地打开百度，输入“电梯调度算法”，出现了诸如“先来先服务算法”、“最短时间优先算法”、“扫描算法”等，与操作系统调度算法如出一辙。深度学习算法万物皆可深度学习，果然百度Paddle的算法工程师在2019年也考虑过这个问题，并举办了这个比赛「电梯调度算法大赛」，并且提供了一个还不错的电梯模拟环境「LiftSim: a configurable lightweight simulator of elevator systems」，并且按照赛题要求是使用强化学...

======= title: Linux使用记录 tags: Linux key: key_25 pageview: true — Ubuntu 安装与卸载安装系统卸载显卡驱动安装驱动丢失 Ubuntu 调节亮度 sudo add-apt-repository ppa:apandada1/brightness-controller sudo apt-get update sudo apt-get install brightness-controller-simple 安装完成后，输入brightness-controller-simple即可调节，每次开机需要重新调节。 Linux 常用操作文件剪切/重命名：mv source target ...

系列产品及关系 «««< HEAD ======= Modelarts Mindspore OBS server b84c9f13c1b028f6e79b7b8674b0d57b935390fb