2012-02-17 87 views
1

我一直在搞乱整天试图找到为什么我的查询性能很糟糕。这非常简单,但可能需要15分钟才能执行(我在该阶段中止查询)。我加入了一张有超过200万条记录的表格。MySQL加入性能极差

这是选择

SELECT 
    audit.MessageID, alerts.AlertCount 
FROM 
    audit 
LEFT JOIN (
     SELECT MessageID, COUNT(ID) AS 'AlertCount' 
     FROM alerts 
     GROUP BY MessageID 
    ) AS alerts ON alerts.MessageID = audit.MessageID 

这是EXPLAIN

| id | select_type | table  | type | possible_keys | key     | key_len | ref | rows | filtered | Extra  | 
| 1 | PRIMARY  | AL   | index | NULL   | IDX_audit_MessageID | 4  | NULL | 2330944 | 100.00 | Using index | 
| 1 | PRIMARY  | <derived2> | ALL | NULL   | NULL     | NULL | NULL | 124140 | 100.00 |    | 
| 2 | DERIVED  | alerts  | index | NULL   | IDX_alerts_MessageID | 5  | NULL | 124675 | 100.00 | Using index | 

这是模式

# Not joining, just showing types 
CREATE TABLE messages (
    ID     int NOT NULL AUTO_INCREMENT, 
    MessageID   varchar(255) NOT NULL, 
    PRIMARY KEY (ID), 
    INDEX IDX_messages_MessageID (MessageID) 
); 

# 2,324,931 records 
CREATE TABLE audit (
    ID     int NOT NULL AUTO_INCREMENT, 
    MessageID   int NOT NULL, 
    LogTimestamp  timestamp NOT NULL, 
    PRIMARY KEY (ID), 
    INDEX IDX_audit_MessageID (MessageID), 
    CONSTRAINT FK_audit_MessageID FOREIGN KEY(MessageID) REFERENCES messages(ID) 
); 

# 124,140 
CREATE TABLE alerts (
    ID     int NOT NULL AUTO_INCREMENT, 
    AlertLevel   int NOT NULL, 
    Text    nvarchar(4096) DEFAULT NULL, 
    MessageID   int DEFAULT 0, 
    PRIMARY KEY (ID), 
    INDEX IDX_alert_MessageID (MessageID), 
    CONSTRAINT FK_alert_MessageID FOREIGN KEY(MessageID) REFERENCES messages(ID) 
); 

需要注意一些非常重要的事项 - 'audit'或'alerts'中的MessageID不是1:1; MessageID可以存在于一个表中,但不能存在于另一个表中,或者可以存在于两者中(这是我加入的目的);在我的测试数据库中,都没有的MessageID存在。换句话说,我的查询将返回230万记录,其中0作为计数。

另一件需要注意的是用于使用MessageID作为varchar(255)的'audit'和'alert'表。我创建了'消息'表,期望它能修复连接。它实际上使其更糟糕。以前,它需要78秒,现在,它永远不会返回。

我对MySQL有什么想法?

回答

1

子查询对于MySQL引擎来说非常难以优化。请尝试:

SELECT 
    audit.MessageID, COUNT(alerts.ID) AS AlertCount 
FROM 
    audit 
LEFT JOIN alerts ON alerts.MessageID = audit.MessageID 
GROUP BY audit.MessageID 
+0

解决了这个问题。谢谢谢谢!如果可以的话,我会给你+10。 – Blazes 2012-02-17 16:37:28

1

您正在加入子查询。

子查询结果实际上是一个临时表 - 请注意查询执行计划中的<derived2>。正如你可以看到的那样,它们没有被索引,因为它们是短暂的。

您应该使用连接将查询作为单个单元执行,而不是连接到第二个查询的结果。

编辑:安德鲁已发布an answer与一个例子如何做你的工作在一个正常的联接查询,而不是在两个步骤。