目前我正在处理从.csv文件到数据库的相当棘手的转换。我必须开发一个package/solution/xxxyyy来处理从这个.csv文件到我的SQL Server数据库的数据流(每天更新新的数据.csv)。从.csv到db的数据传输。哪一个是最好的方法?
我的老板“建议”我应该使用的方法是通过SSIS(通常我会写一些“解析器”来轻松地将数据从.csv中转移出去)。事实是,我有相当多的转变要做。
即
员工有这个字段:
name;surname;id;roles
字段 “角色” 的格式是这样的:
role1,role2,role3
在我的分贝这种关系是在3页不同的表映射:
tblEmployee
PK_Emp | name | surname
tblRoles
PK_Role | roleName
tblEmployeeRole
PK_Emp | PK_Role
所以,从.csv我必须提取单个员工的角色,插入tblRoles(检查没有重复)。然后我必须在tblEmployeeRole中管理关系。
考虑到这仅仅是我必须管理的一种不同转换的例子,我想知道SSIS是否是实现我的目标(加载脚本组件)的最佳工具。当我解释我的困惑给我的老板,他想出了这个“主意”:
使用SSIS来传输数据,因为它们是在一个临时表,然后通过存储过程处理不同的转换。
从我对存储过程的了解很少,我不确定我应该遵循这个想法。 现在,考虑到我的实际上司不是那个开明的项目经理(他通常会用奇怪的想法搞砸我们的工作),并且考虑到我不是SSIS和存储过程中的专家,我决定写在这里,看看是否有人能解释我,如果以前的方法之一是正确的,或者如果我不得不考虑一些其他(更好)的解决方案。
对不起,我的英文不好,TY任何帮助=)
id是我们可以用来唯一标识一行的东西吗? – billinkc 2012-02-24 21:28:52