欢迎来到‘玄策’中文文档!

玄策 是一个深度强化学习(Deep Reinforcement Learning, DRL)开源算法库。“玄”字意为玄妙的,“策”意为策略。 在深度强化学习算法中,智能体通过和环境交互不断试错,最终学习出一个最优策略完成任务,而不需要对环境或动力学模型建立精确的模型,因此该算法库被称为“玄妙的策略”,故而取名“玄策”。

此外,虽然深度强化学习能够解决很多复杂的任务,但是在算法调试的过程中,深度神经网络和优化过程对超参数往往比较敏感。 对于某特殊结构的算法,要想调出一组最佳的超参数,往往需要开发人员进行大量的试错。 由于对超参数调试的方法主要以来开发人员的经验,难以总结出一条通用的规律,因此常被戏称为“玄学”。 而该算法库提供了大量目前主流的DRL算法,其实现过程易于理解,使得算法的复现不再玄学。 “玄策”的适用人群包括但不限于:人工智能方向学生,DRL开发人员,DRL入门学习者,等。

“玄策”目前同时支持多种深度学习框架,包括 PyTorchTensorFlow,和 MindSpore。并且支持CPU、GPU运算,能够在Linux,Windows,MacOS等操作系统上运行。

“玄策”的 主要特征 总结如下:
  • 支持PyTorch,TensorFlow2,MindSpore三种深度学习框架。

  • 可在Linux,Windows,MacOS等操作系统上运行。

  • 安装方便,代码易读,上手简单。

  • 支持丰富的算法,包括单智能体、多智能体协作、多智能体对抗博弈等任务。

目前,“玄策”已在GitHub和OpenI社区开源,链接如下:









Indices and tables