热门标签【pi_】- 幻海软件

深度强化学习（DRL）简介与常见算法（DQN，DDPG，PPO，TRPO，SAC）分类
简单介绍深度强化学习的基本概念，常见算法、流程及其分类（持续更新中），方便大家更好的理解、应用强化学习算法，更好地解决各自领域面临的前沿问题。欢迎大家留言讨论，共同进步。（PS：如果仅关注算法实现，可直接阅读第3和4部分内容。）1.强化学习ReinforcementLearning（RL）：强化学习

推荐阅读

Python爬虫抓取技术的门道

web是一个开放的平台，这也奠定了web从90年代初诞生直至今日将近30年来蓬勃的发展。然而，正所谓成也萧何败也萧何，开放的特性、搜索引擎以及简单易学的html、css技术使得web成为了互联网领域里最为流行和成熟的信息传播媒介;但如今作为商业化软件，web这个平台上的内容信息的版权却毫无保证，因为

Elasticsearch分布式架构原理，我们真的需要知道，很重要

Elasticsearch用于构建高可用和可扩展的系统。扩展的方式可以是购买更好的服务器(纵向扩展(verticalscaleorscalingup))或者购买更多的服务器(横向扩展(horizontalscaleorscalingout))。Elasticsearch虽然能从更强大的硬件中获得更好

手把手教你抖音系列视频批量下载器开发

程序使用演示大家好，我是小小明。这里开发了一个抖音视频下载器，打开效果如下：如果本地的谷歌游览器之前从来没有访问过抖音主页，点击开始下载按钮会有如下输出：此时我们只需要点击访问抖音主页，程序则会使用本地的谷歌游览器访问抖音主页。再次点击下载按钮：可以看到该视频是一个合集视频：那么程序只需要勾选第一个

Antd Mobile 作者教你写 React 受控组件和非受控组件

曾经，我每次面试时几乎都会问一个问题：antd中的Input组件是受控组件还是非受控组件？有些人会毫不犹豫的回答：是受控组件，因为有 value 和 onChange，而另外也有一些人会比较犹豫，因为的确似乎说Input是受控组件或非受控组件都说得过去。当然，实际上In

三种方案 | 抛弃for循环，让Python代码更pythonic !

为什么要挑战自己在代码里不写forloop？因为这样可以迫使你去学习使用比较高级、比较地道的语法或library。文中以python为例子，讲了不少大家其实在别人的代码里都见过、但自己很少用的语法。自从我开始探索Python中惊人的语言功能已经有一段时间了。一开始，我给自己一个挑战，目的是让我练习更

面试热点题：回溯算法电话号码的字母组合与组合总和

前言：如果你一点也不了解什么叫做回溯算法，那么推荐你看看这一篇回溯入门，让你快速了解回溯算法的基本原理及框架电话号码的字母组合给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。来源：力扣（LeetC

深圳幻海软件技术有限公司