2009-02-06 100 views
3

我有一个数据集与DataRelations(经典顺序头/细节对)链接在一起的一些DataTables。是否有一种简单的方法将整个批量归一化为一个DataTable,并将相关表的所有列归一化?非规范化数据集

表名和列在编译时未知,并且可能有两个以上的表/关系。

回答

2

我的自我也有同样的问题,但由于这个问题没有答案,我不得不写自己的denormalizer。原来并不是那么困难 - 所以这是您(或其他遇到此问题的其他人)可能能够使用/扩展的第一次切割:

public class DataSetDenormalizer 
{ 
    public void DenormalizeRelationships(DataSet dataSet) 
    { 
     IOrderedEnumerable<DataRelation> orderedRelationship = SortRelationshipsByNumberOfChildRows(dataSet); 
     var tablesToRemove = new List<DataTable>(); 

     foreach (DataRelation relationship in orderedRelationship) 
     { 
      DenormalizeColumns(relationship); 
      DenormalizeData(relationship); 
      RemoveDenormalizedRelationships(dataSet, relationship, tablesToRemove); 
     } 
    } 

    private IOrderedEnumerable<DataRelation> SortRelationshipsByNumberOfChildRows(DataSet dataSet) 
    { 
     var relationships = new List<DataRelation>(); 
     foreach (DataRelation relationship in dataSet.Relations) 
      relationships.Add(relationship); 
     return relationships.OrderBy(r => r.ChildTable.Rows.Count); 
    } 

    private void DenormalizeColumns(DataRelation relationship) 
    { 
     for (int columnIndex = 0; columnIndex < relationship.ParentTable.Columns.Count; ++columnIndex) 
     { 
      DataColumn column = relationship.ParentTable.Columns[columnIndex]; 
      if (relationship.ParentColumns.Contains(column)) continue; 
      relationship.ChildTable.Columns.Add(new DataColumn(column.ColumnName, column.DataType)); 
     } 
    } 

    private void DenormalizeData(DataRelation relationship) 
    { 
     for (int rowIndex = 0; rowIndex < relationship.ChildTable.Rows.Count; ++rowIndex) 
     { 
      DataRow row = relationship.ChildTable.Rows[rowIndex]; 
      DataRow parentRow = row.GetParentRow(relationship); 

      for (int columnIndex = 0; columnIndex < relationship.ParentTable.Columns.Count; ++columnIndex) 
      { 
       DataColumn column = relationship.ParentTable.Columns[columnIndex]; 
       if (relationship.ChildTable.Columns.Contains(column.ColumnName)) 
       { 
        row.SetField(column.ColumnName, parentRow[column]); 
       } 
      } 
     } 
    } 

    private void RemoveDenormalizedRelationships(DataSet dataSet, DataRelation relationship, List<DataTable> tablesToRemove) 
    { 
     dataSet.Relations.Remove(relationship); 
     relationship.ChildTable.Constraints.Remove(relationship.RelationName); 

     if (!tablesToRemove.Contains(relationship.ParentTable)) 
      tablesToRemove.Add(relationship.ParentTable); 

     int numberOfColumns = relationship.ChildColumns.Length; 
     for (int columnIndex = 0; columnIndex < numberOfColumns; ++columnIndex) 
     { 
      relationship.ChildTable.Columns.Remove(relationship.ChildColumns[columnIndex]); 
     } 
    } 
} 
0

我不认为数据集本身支持这个,但在代码中很容易做到。

首先,您应该创建一个空数据表,然后从两个要组合的表中添加所需的所有列。

然后,您逐步浏览主表中的数据,并逐步查看相关表中的所有相关行。对于相关表中的每一行,您都可以在新表中创建一个新行,并将这两个数据行中的数据插入到新行中。

我现在无法访问visual studio,但您明白了。