在本文中,我们将了解如何在不离开线性优化空间的情况下,高效地将更多关于状态特征的有价值信息注入目标函数中。不要错过维亚切斯拉夫·叶菲莫夫强化学习系列的最新部分。https://towardsdatascience.com/reinforcement-learning-part-8-feature-state-construction-62e7d2fc5152