盘搜 Pan996.xyz

盘搜 pan996.xyz

梗直哥瞿炜-强化学习必修课：引领人工智能新时代

发布时间：	2025-05-02 10:36
发布者：	panjdzy
资源来源：	夸克网盘
资源状态：	【资源纠错】
标签：	梗直 / 强化学习 / 必修课 / 引领 / 人工智能 / 新时代 /

成为VIP用户，可查看完整网盘下载地址。

网盘快照

梗直哥瞿炜-强化学习必修课：引领人工智能新时代 ( - )

第二章数学知识回顾：凡事预则立，不预则废 ( - )

1_2-1-线性代数【耗时整理‖免费分享 cunlove.cn】.mp4 ( 16.45MB )
2_2-2-微积分【耗时整理‖免费分享 cunlove.cn】.mp4 ( 17.44MB )
3_2-3-概率【耗时整理‖免费分享 cunlove.cn】.mp4 ( 25.84MB )

第三章环境安装和工具使用：工欲善其事，必先利其器 ( - )

1_3-1-CUDA+Anaconda深度学习环境配置【耗时整理‖免费分享 cunlove.cn】.mp4 ( 11.47MB )
2_3-2-conda使用命令【耗时整理‖免费分享 cunlove.cn】.mp4 ( 8.30MB )
3_3-3-Jupyter-Notebook快速上手【耗时整理‖免费分享 cunlove.cn】.mp4 ( 8.67MB )
4_3-4-仿真环境Gym安装【耗时整理‖免费分享 cunlove.cn】.mp4 ( 10.82MB )
5_3-5-深度学习库PyTorch的安装【耗时整理‖免费分享 cunlove.cn】.mp4 ( 5.77MB )

第四章马尔可夫随机过程：憧憬和行动中追寻生命的意义 ( - )

1_4-1-序列建模与概率图模型【耗时整理‖免费分享 cunlove.cn】.mp4 ( 21.35MB )
2_4-2-马尔可夫观测过程：学会“看”【耗时整理‖免费分享 cunlove.cn】.mp4 ( 22.32MB )
3_4-3-马尔可夫决策过程：试着-“干”【耗时整理‖免费分享 cunlove.cn】.mp4 ( 16.47MB )
4_4-4-马尔可夫奖励过程：懂得“想”【耗时整理‖免费分享 cunlove.cn】.mp4 ( 27.02MB )
5_4-5-贝尔曼方程：迭代求解价值函数【耗时整理‖免费分享 cunlove.cn】.mp4 ( 16.79MB )
6_4-6-模型分类与选择【耗时整理‖免费分享 cunlove.cn】.mp4 ( 17.66MB )
7_4-7-常见问题解析【耗时整理‖免费分享 cunlove.cn】.mp4 ( 11.52MB )
8_4-8-马尔可夫过程代码实现【耗时整理‖免费分享 cunlove.cn】.mp4 ( 21.20MB )

第五章动态规划方法：理想国中的完美人生 ( - )

1_5-1-动态回归核心思想和原理【耗时整理‖免费分享 cunlove.cn】.mp4 ( 15.76MB )
2_5-2-策略迭代【耗时整理‖免费分享 cunlove.cn】.mp4 ( 21.32MB )
3_5-3-价值迭代【耗时整理‖免费分享 cunlove.cn】.mp4 ( 10.66MB )
4_5-4-动态规划代码实现【耗时整理‖免费分享 cunlove.cn】.mp4 ( 23.48MB )

第六章经典无模型方法：离散世界的价值最大化 ( - )

1_6-1-蒙特卡洛方法【耗时整理‖免费分享 cunlove.cn】.mp4 ( 17.88MB )
2_6-2-时序差分方法【耗时整理‖免费分享 cunlove.cn】.mp4 ( 18.28MB )
3_6-3-蒙特卡洛方法和时序差分代码实现【耗时整理‖免费分享 cunlove.cn】.mp4 ( 13.43MB )
4_6-4-广义策略迭代【耗时整理‖免费分享 cunlove.cn】.mp4 ( 10.69MB )
5_6-5-Q-Learning算法【耗时整理‖免费分享 cunlove.cn】.mp4 ( 17.67MB )
6_6-6-SARSA算法【耗时整理‖免费分享 cunlove.cn】.mp4 ( 11.08MB )
7_6-7-Q-Learning&SARSA代码实现【耗时整理‖免费分享 cunlove.cn】.mp4 ( 13.23MB )

第七章深度Q网络：他山之石，可以攻玉 ( - )

1_7-1-深度Q网络核心思想和原理【耗时整理‖免费分享 cunlove.cn】.mp4 ( 24.01MB )
2_7-2-DQN-代码实现【耗时整理‖免费分享 cunlove.cn】.mp4 ( 19.66MB )
3_7-3-常见问题改进和扩展【耗时整理‖免费分享 cunlove.cn】.mp4 ( 14.94MB )
4_7-4-DQN改进算法代码实现【耗时整理‖免费分享 cunlove.cn】.mp4 ( 18.23MB )

第八章深度策略梯度方法：行胜于言，止于至善 ( - )

1_8-1-策略梯度核心思想和原理【耗时整理‖免费分享 cunlove.cn】.mp4 ( 22.65MB )
2_8-2-蒙特卡洛策略梯度【耗时整理‖免费分享 cunlove.cn】.mp4 ( 13.29MB )
3_8-3-策略梯度方法代码实现【耗时整理‖免费分享 cunlove.cn】.mp4 ( 11.42MB )
4_8-4-近端策略优化算法【耗时整理‖免费分享 cunlove.cn】.mp4 ( 19.66MB )
5_8-5-近端策略优化（PPO）代码实现【耗时整理‖免费分享 cunlove.cn】.mp4 ( 19.42MB )

第九章演员-评论家算法：戏为兄弟，共荣共生 ( - )

1_9-1-演员评论家算法核心思想和原理【耗时整理‖免费分享 cunlove.cn】.mp4 ( 12.83MB )
2_9-2-改进型演员评论家算法【耗时整理‖免费分享 cunlove.cn】.mp4 ( 13.38MB )
3_9-3-演员评论家算法代码实现【耗时整理‖免费分享 cunlove.cn】.mp4 ( 12.99MB )
4_9-4-深度确定性策略梯度【耗时整理‖免费分享 cunlove.cn】.mp4 ( 18.12MB )
5_9-5-DDPG算法代码实现【耗时整理‖免费分享 cunlove.cn】.mp4 ( 16.05MB )
6_9-6-软性演员评论家算法【耗时整理‖免费分享 cunlove.cn】.mp4 ( 23.94MB )
7_9-7-SAC代码实现【耗时整理‖免费分享 cunlove.cn】.mp4 ( 21.53MB )

第十章基于模型的强化学习：看不见的上帝之手 ( - )

1_10-1-基于模型的强化学习核心思想和原理【耗时整理‖免费分享 cunlove.cn】.mp4 ( 28.46MB )
2_10-2-Dyna-Q算法【耗时整理‖免费分享 cunlove.cn】.mp4 ( 24.97MB )
3_10-3-Dyna-Q算法代码实现【耗时整理‖免费分享 cunlove.cn】.mp4 ( 11.75MB )
4_10-4-基于模型的策略优化【耗时整理‖免费分享 cunlove.cn】.mp4 ( 12.27MB )
5_10-5-MBPO的代码实现【耗时整理‖免费分享 cunlove.cn】.mp4 ( 34.99MB )

第十一章进阶强化学习：欲穷千里目，更上一层楼 ( - )

1_11-1模仿学习【耗时整理‖免费分享 cunlove.cn】.mp4 ( 24.63MB )
2_11-2-博弈论与强化学习【耗时整理‖免费分享 cunlove.cn】.mp4 ( 32.61MB )
3_11-3-多智能体强化学习【耗时整理‖免费分享 cunlove.cn】.mp4 ( 22.89MB )
4_11-4-MADDP的代码实现【耗时整理‖免费分享 cunlove.cn】.mp4 ( 24.65MB )
5_11-5-AlphaStar系统【耗时整理‖免费分享 cunlove.cn】.mp4 ( 46.57MB )
6_11-6-基于人类反馈大强化学习【耗时整理‖免费分享 cunlove.cn】.mp4 ( 23.40MB )

最新分享者更新

发布资源 yizhiyansha的网盘资源 Neever的网盘资源小红帽的网盘资源 Bear's Robot的网盘资源每日更新网盘资源的网盘资源清风不识字的网盘资源网盘资源分享的网盘资源影视库吧的网盘资源 1163304460资源库的网盘资源软件百科的网盘资源爱分享的网盘资源拉屎震天响的网盘资源 qytf_3817的网盘资源资源精选的网盘资源牛油果的网盘资源优选资源库的网盘资源 351264985的网盘资源小胖子的网盘资源阿休的网盘资源都是真资源的网盘资源 kkkk277的网盘资源无忧资源的网盘资源 2509419517的网盘资源 806471940的网盘资源 740024614的网盘资源 qg3e8iov的网盘资源大师兄的网盘资源拉屎震碎马桶盖的网盘资源资源库每日更的网盘资源独乐乐不如众乐乐的网盘资源 18800566899的网盘资源影隐剧社的网盘资源 [email protected]的网盘资源滴滴的网盘资源云影幕的网盘资源鑫峰资源库的网盘资源 3066602800的网盘资源仓鼠分享的网盘资源 TV社長的网盘资源 3395184831的网盘资源

相关资源

最新资源

收到您的反馈后，管理员核实后将会屏蔽相关链接！

资源名称

梗直哥瞿炜-强化学习必修课：引领人工智能新时代

举报类型

资源内容为空

资源内容和名称不匹配

资源含解压密码、资源失效、无法打开等

引导加微信或者关注公众号、二次收费等

涉嫌侵权

含含色情、暴力内容

其他

Email(可留空)

内容(可留空)

本站内容由网络爬虫自动抓取，以非人工方式自动生成。
本站不储存、复制、传播任何文件，其网盘资源文件的完整性需要您自行判断。
免责声明 - 留言板

Copyright © 2024 All Rights Reserved.1785012