我应该如何管理引用网站“活动”的表格。即用户在我用于跟踪的网站上完成的某些活动。我希望能够在用户的不同活动和他们所做的事情之间进行各种数据挖掘和关联。管理网站“活动”数据库
仅今天我就向我的SiteEvent表添加了107,000行。我不认为这是可持续的!
数据库是SQL Server。我主要是指关于管理大量数据的最佳实践活动。
例如:
- 我应该把这些表中的所有自己的数据库?如果我需要加入其他表格,这可能是一个问题。目前,我只有一个数据库的一切。
- 我应该如何清除旧记录。我想确保我的db文件不会不断增长。
- 备份和截断日志的最佳做法
- 添加其他索引是否会显着增加具有如此多记录的数据库的大小?
- 任何其他的事情,我需要在SQL Server中,可能会回来咬我以后呢?
供参考:这些都是表
CREATE TABLE [dbo].[SiteEvent](
[SiteEventId] [int] IDENTITY(1,1) NOT NULL,
[SiteEventTypeId] [int] NOT NULL,
[SiteVisitId] [int] NOT NULL,
[SiteId] [int] NOT NULL,
[Date] [datetime] NULL,
[Data] [varchar](255) NULL,
[Data2] [varchar](255) NULL,
[Duration] [int] NULL,
[StageSize] [varchar](10) NULL,
和
CREATE TABLE [dbo].[SiteVisit](
[SiteVisitId] [int] IDENTITY(1,1) NOT NULL,
[SiteUserId] [int] NULL,
[ClientGUID] [uniqueidentifier] ROWGUIDCOL NULL CONSTRAINT [DF_SiteVisit_ClientGUID] DEFAULT (newid()),
[ServerGUID] [uniqueidentifier] NULL,
[UserGUID] [uniqueidentifier] NULL,
[SiteId] [int] NOT NULL,
[EntryURL] [varchar](100) NULL,
[CampaignId] [varchar](50) NULL,
[Date] [datetime] NOT NULL,
[Cookie] [varchar](50) NULL,
[UserAgent] [varchar](255) NULL,
[Platform] [int] NULL,
[Referer] [varchar](255) NULL,
[RegisteredReferer] [int] NULL,
[FlashVersion] [varchar](20) NULL,
[SiteURL] [varchar](100) NULL,
[Email] [varchar](50) NULL,
[FlexSWZVersion] [varchar](20) NULL,
[HostAddress] [varchar](20) NULL,
[HostName] [varchar](100) NULL,
[InitialStageSize] [varchar](20) NULL,
[OrderId] [varchar](50) NULL,
[ScreenResolution] [varchar](50) NULL,
[TotalTimeOnSite] [int] NULL,
[CumulativeVisitCount] [int] NULL CONSTRAINT [DF_SiteVisit_CumulativeVisitCount] DEFAULT ((0)),
[ContentActivatedTime] [int] NULL CONSTRAINT [DF_SiteVisit_ContentActivatedTime] DEFAULT ((0)),
[ContentCompleteTime] [int] NULL,
[MasterVersion] [int] NULL CONSTRAINT [DF_SiteVisit_MasterVersion] DEFAULT ((0)),
是的!我绝对想要这样做!这仅仅是每个访问者大约9个事件,尽管它不是完全矫枉过正。加上我们预计会有更多流量来临 – Simon 2008-10-23 07:13:10