Home

课程-强化学习

课程大纲 Lecture 1: Overview(课程概括与RL基础) Lecture 2: Markov Decision Process(马尔科夫决策过程)) Lecture 3: Model-free Prediction and Control(无模型的预测和控制) Lecture 4: On-policy and Off-policy Learning() Lecture 5: Value Function Approximation(价值函数近似) Lecture 6: Policy Optimization: Foundation(策略优化基础) Lecture 7: Policy Optimization: State of the Ar...

Read more

电梯调度算法研究

研究起因 在「字节范儿」一期公众号推送《我走过最迷的路,是字节跳动程序员的脑回路》上看到这样一个段子: 想起来我也曾经不止一次在等电梯的时候思考过这个问题,因此这次决定好好研究下这个调度算法。 传统算法 熟练地打开百度,输入“电梯调度算法”,出现了诸如“先来先服务算法”、“最短时间优先算法”、“扫描算法”等,与操作系统调度算法如出一辙。 深度学习算法 万物皆可深度学习,果然百度Paddle的算法工程师在2019年也考虑过这个问题,并举办了这个比赛「电梯调度算法大赛」,并且提供了一个还不错的电梯模拟环境「LiftSim: a configurable lightweight simulator of elevator systems」,并且按照赛题要求是使用强化学...

Read more

Linux

======= title: Linux使用记录 tags: Linux key: key_25 pageview: true — Ubuntu 安装与卸载 安装 系统卸载 显卡驱动安装 驱动丢失 Ubuntu 调节亮度 sudo add-apt-repository ppa:apandada1/brightness-controller sudo apt-get update sudo apt-get install brightness-controller-simple 安装完成后,输入brightness-controller-simple即可调节,每次开机需要重新调节。 Linux 常用操作 文件剪切/重命名:mv source target ...

Read more

Paper Writing

学术论文写作 南开程明明老师课程及课件: https://mmcheng.net/writing/ 包含中文Latex论文模板、LatexPPT模板等

Read more