我试图做一个基于视觉的强化学习机器人为井字游戏,并坚持如何保存数据并快速检索它。有效的方法来存储数组,并检查它们是否存在于Python
因此,将数据保存为例如起始点列表为[0, 0, 0, 0, 0, 0, 0, 0, 0]
,并为该[0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]
启动策略。
问题是: 在什么格式,我应该保存当前的状态和政策,所以我可以访问它的快速检查,如果状态已经存在,并且更新的政策?我在考虑pandas
和pickle
,但发现使用列表实现有点困难。
你想保存什么样的数据?你想有效地拿出什么?数据是否分类? – mrCarnivore
您是否试图专注于9个元素的列表的性能? – Adirio
数据不会被排序,机器人截取游戏截图,将其转换为列表并将井字游戏状态存储为9长列表,但在机器人学习之后会有数千个状态,并且随着机器人更新它的策略,我必须检索状态是否存在,并且是否存在针对当前状态的某种策略,否则:将数据附加新状态和“零策略”。 –