我想从一堆XML文件中提取一些数据。我有一个工作的解析器/提取器,但我无法让它很好地坐在数据库中。Python - 首先使用类 - 这是一个合适的方法吗?
我正在尝试一个非常平坦的简单表来容纳我所有的数据,而且这太复杂了,不能将我的元素拉回到一起。
回顾了我正在尝试做的事情之后,我构建了一个似乎符合法案的MySQL数据模型。它包含几个表格,所以下一个任务是建立一个方法,将提取的数据放入适当的表格(检查dup值等)
我计划为每个数据块编写一个泛型类,这会将我提交的数据对象,转到相应的表,检查它是否已经存在,如果它不应该将它添加到表中,并将键值写入第二个表中。如果它确实存在,那么简单的方法就是撤回键值,并将其写入第二个表格。
我不知道如何在伪代码中对此进行描述,但这看起来像是一个明智的方法吗? 另一种方法似乎是为每个数据块编写一个特定的连接器/检查器/更新器(并且我的意思是一个或n个特定的标记数据在一个表中具有适当的主页)。
“这是一个很好的方法”对于堆栈溢出来说太开放和主观。 – agf 2012-04-18 05:54:18
好的。指出。我没有具体的方法,我正在寻求一些建议,更多的是一个班会在这个广泛的场景中“工作”。我应该补充一点,我对如何使用类没有太清楚的了解,并且不想花时间尝试构建永远不会工作的东西......谢谢 – 2012-04-18 05:57:19
您当然会使用类 - 基本上使用类一切都在Python中。虽然很好,但是你找到了一个可以工作的数据库模式,但你应该真正考虑使用SQLAlchemy,SQLObject等对象关系映射器(ORM),并设计类来建模数据,而不是设计数据库表。您正在重新发明轮子,尤其是如果您编写了自己的XML解析器。 – agf 2012-04-18 05:59:51