欢迎来到‘玄策’中文文档!¶

玄策是一个深度强化学习（Deep Reinforcement Learning, DRL）开源算法库。“玄”字意为玄妙的，“策”意为策略。在深度强化学习算法中，智能体通过和环境交互不断试错，最终学习出一个最优策略完成任务，而不需要对环境或动力学模型建立精确的模型，因此该算法库被称为“玄妙的策略”，故而取名“玄策”。

此外，虽然深度强化学习能够解决很多复杂的任务，但是在算法调试的过程中，深度神经网络和优化过程对超参数往往比较敏感。对于某特殊结构的算法，要想调出一组最佳的超参数，往往需要开发人员进行大量的试错。由于对超参数调试的方法主要以来开发人员的经验，难以总结出一条通用的规律，因此常被戏称为“玄学”。而该算法库提供了大量目前主流的DRL算法，其实现过程易于理解，使得算法的复现不再玄学。 “玄策”的适用人群包括但不限于：人工智能方向学生，DRL开发人员，DRL入门学习者，等。

“玄策”目前同时支持多种深度学习框架，包括 PyTorch， TensorFlow，和 MindSpore。并且支持CPU、GPU运算，能够在Linux，Windows，MacOS等操作系统上运行。

“玄策”的 主要特征 总结如下：

支持PyTorch，TensorFlow2，MindSpore三种深度学习框架。
可在Linux，Windows，MacOS等操作系统上运行。
安装方便，代码易读，上手简单。
支持丰富的算法，包括单智能体、多智能体协作、多智能体对抗博弈等任务。

目前，“玄策”已在GitHub和OpenI社区开源，链接如下：

GitHub： https://github.com/agi-brain/xuance.git

OpenI： https://github.com/agi-brain/xuance.git

如何使用:

API:

参考基准

算法介绍

欢迎来到‘玄策’中文文档!¶

Indices and tables¶