模拟退火算法从原理到实战【基础篇】
模拟退火算法来源于固体退火原理,将固体加温至充分高,再让其徐徐冷却,加温时,固体内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小。
(zhuan) 一些RL的文献(及笔记)
一些RL的文献(及笔记)
copy from: https://zhuanlan.zhihu.com/p/25770890
Introductions
Introduction to reinforcement learningIndex of /rowan/files/rlICML Tutorials:http://icml.