2013-02-13 95 views
8

经过大量搜索并将使用Web上的FOR XML和.nodes()命令转换结果集的非常优秀的技术拼凑起来之后,我能够创建这个单一的查询(不是存储过程),它将任何任意的SQL查询转换为JSON数组做了相当不错的工作。改进SQL Server查询以将任意表转换为JSON

该查询会将每个数据行编码为带逗号前导的单个JSON对象。 数据行被括号括起来,然后整个结果集将被导出到一个文件。

我想看看有没有人能看到改善其性能的方法?

下面是一个示例表查询:

declare @xd table (col1 varchar(max), col2 int, col3 real, colNull int) 

insert into @xd 
select '', null, null, null 
UNION ALL select 'ItemA', 123, 123.123, null 
UNION ALL select 'ItemB', 456, 456.456, null 
UNION ALL select '7890', 789, 789.789, null 

select '[{}' 
UNION ALL 
select ',{' + STUFF((
    (select ',' 
     + '"' + r.value('local-name(.)', 'varchar(max)') + '":' 
     + case when r.value('./@xsi:nil', 'varchar(max)') = 'true' then 'null' 
     when isnumeric(r.value('.', 'varchar(max)')) = 1 
      then r.value('.', 'varchar(max)') 
     else '"' + r.value('.', 'varchar(max)') + '"' 
     end 
    from rows.nodes('/row/*') as x(r) for xml path('')) 
    ), 1, 1, '') + '}' 
from (
    -- Arbitrary query goes here, (fields go where t.* is, table where @xd t is) 
    select (select t.* for xml raw,type,elements XSINIL) rows 
    from @xd t 
) xd 
UNION ALL 
select ']' 

我最大的批判它,就是它的出奇的慢。
目前大约需要3点半~42,000行。

我的另一个大的批评是,它目前假设所有看起来像数字的东西都是数字。它不尝试发现列类型(至少我不确定它是否可以)。

最后一个小问题是,第一个数据行在前面会有一个逗号,在技术上它不应该。为了弥补这一点,它需要在第一行中启动JSON数组的空JSON对象。

其他的批评(最好是有解决方案的)被邀请,我唯一真正的限制是该解决方案在很多任意的SQL查询中可以重复使用,而无需明确标识列名。

我使用SQL Server 2012的

感谢,并给其他人喜欢我,谁一直在寻找一个广义SQL结果 - > JSON数组转换器,尽情享受!

+0

虽然我很赞赏你的SQL福,我要问:为什么?真实世界中你需要这样做的场景是什么?我不想在这里消极,只是为什么你需要这个而感到困惑。 – 2013-02-14 00:03:12

+0

在这种情况下,我正在寻找一种特别的方式来快速将结果集加载到NoSQL数据库(如CouchDB)中,而无需构建大量基础结构或将任何内容添加到我的生产SQL环境中。 Mongo,Couch等人。似乎使用JSON作为数据传输的通用语言。一旦进入NoSQL数据库,我们可以尝试对数据集进行切片和切块,以了解它们的性能。复制CouchDB数据库以在远程桌面,便携式计算机,智能手机等上创建本地存储库比管理SQL复制基础架构要容易得多。所以我们正在做一些尽职调查。 – 2013-02-14 00:30:10

+0

让我们不要在这里被愚弄,大多数是通过搜索现有的SQL到JSON和SQL来找到键/值对的答案。是的,我把它放在一起,通过UNION ALL在它周围放置了一些括号,使用case语句来处理引号更聪明一点,并开始尝试使用XSINIL的东西(也许我甚至知道其中一些实际上是如何工作的; ))但我真的不能承认这一点。关于我最近做的唯一事情是将底部的子查询合并为一个XML数据集,然后让上层查询将其转换为键/值对。 – 2013-02-14 01:02:38

回答

11

我说如果你真的想提高性能,使用元编程。下面的例子用40,000行来尝试这一点,并在不到一秒的时间内返回结果(不包括插入最初的40k行,在这个例子中只占用大约2秒)。它还考虑到您的数据类型不包含引号中的数字。

declare @xd table (col1 varchar(max), col2 int, col3 real, colDate datetime, colNull int); 

declare @i int = 0; 

while @i < 10000 begin 
    set @i += 1; 
    insert into @xd 
    select '', null, null, null, null 
    union all select 'ItemA', 123, 123.123, getDate(), null 
    union all select 'ItemB', 456, 456.456, getDate(), null 
    union all select '7890', 789, 789.789, getDate(), null; 
end; 

select * 
into #json_base 
from (
    -- Insert SQL Statement here 
    select * from @xd 
) t; 

declare @columns table (
    id int identity primary key, 
    name sysname, 
    datatype sysname, 
    is_number bit, 
    is_date bit); 

insert into @columns(name, datatype, is_number, is_date) 
select columns.name, types.name, 
     case when number_types.name is not NULL 
      then 1 else 0 
     end as is_number, 
     case when date_types.name is not NULL 
      then 1 else 0 
     end as is_date 
from tempdb.sys.columns 
join tempdb.sys.types 
    on (columns.system_type_id = types.system_type_id) 
left join (values ('int'), ('real'), ('numeric'), 
        ('decimal'), ('bigint'), ('tinyint')) as number_types(name) 
    on (types.name = number_types.name) 
left join (values ('date'), ('datetime'), ('datetime2'), 
        ('smalldatetime'), ('time'), ('datetimeoffset')) as date_types(name) 
    on (types.name = date_types.name) 
where object_id = OBJECT_ID('tempdb..#json_base'); 

declare @field_list varchar(max) = STUFF((
    select '+'',''+' + QUOTENAME(QUOTENAME(name, '"') + ':', '''') 
      + '+' + case when is_number = 1 
         then 'COALESCE(LTRIM(' 
           + QUOTENAME(name) + '),''null'')' 
         when is_date = 1 
         then 'COALESCE(QUOTENAME(LTRIM(convert(varchar(max), ' 
           + QUOTENAME(name) + ', 126)),''"''),''null'')' 
         else 'COALESCE(QUOTENAME(' 
           + QUOTENAME(name) + ',''"''),''null'')' 
        end 
    from @columns 
    for xml path('')), 
    1, 5, ''); 

create table #json_result (
    id int identity primary key, 
    line varchar(max)); 

declare @sql varchar(max) = REPLACE(
    'insert into #json_result ' 
    + 'select '',{''+{f}+''}'' ' 
    + 'from #json_base', '{f}', @field_list); 

exec(@sql); 

update #json_result 
set line = STUFF(line, 1, 1, '') 
where id = 1; 

select '[' 
UNION ALL 
select line 
from #json_result 
UNION ALL 
select ']'; 

drop table #json_base; 
drop table #json_result; 
+0

不错。我知道我不应该睡在它上面 - 这也是我要建议的方法。实际上可能变得非常有用... – 2013-02-14 12:48:11

+0

不错!在我的实际桌子上只有6秒钟。另一个副作用是日期,因为2月8日2013年12:00 AM。让我看看 – 2013-02-14 16:58:38

+0

好吧,我扩展了我的解决方案以添加一个“is_date”位字段,在接受之前是否适合使用我的修改来调整原始答案?感谢您向我展示如何加入“价值观”,我从未见过这种技术。这很酷! – 2013-02-14 17:46:26

1

Firoz Ansari

CREATE PROCEDURE [dbo].[GetJSON] (
@ParameterSQL AS VARCHAR(MAX) 
) 
AS 
BEGIN 

DECLARE @SQL NVARCHAR(MAX) 
DECLARE @XMLString VARCHAR(MAX) 
DECLARE @XML XML 
DECLARE @Paramlist NVARCHAR(1000) 
SET @Paramlist = N'@XML XML OUTPUT' 
SET @SQL = 'WITH PrepareTable (XMLString) ' 
SET @SQL = @SQL + 'AS (' 
SET @SQL = @SQL + @ParameterSQL+ ' FOR XML RAW, TYPE, ELEMENTS ' 
SET @SQL = @SQL + ') ' 
SET @SQL = @SQL + 'SELECT @XML = XMLString FROM PrepareTable ' 
EXEC sp_executesql @SQL, @Paramlist, @[email protected] OUTPUT 
SET @XMLString = CAST(@XML AS VARCHAR(MAX)) 

DECLARE @JSON VARCHAR(MAX) 
DECLARE @Row VARCHAR(MAX) 
DECLARE @RowStart INT 
DECLARE @RowEnd INT 
DECLARE @FieldStart INT 
DECLARE @FieldEnd INT 
DECLARE @Key VARCHAR(MAX) 
DECLARE @Value VARCHAR(MAX) 

DECLARE @StartRoot VARCHAR(100); SET @StartRoot = '' 
DECLARE @EndRoot VARCHAR(100); SET @EndRoot = '' 
DECLARE @StartField VARCHAR(100); SET @StartField = '' 

SET @RowStart = CharIndex(@StartRoot, @XMLString, 0) 
SET @JSON = '' 
WHILE @RowStart &gt; 0 
BEGIN 
    SET @RowStart = @RowStart+Len(@StartRoot) 
    SET @RowEnd = CharIndex(@EndRoot, @XMLString, @RowStart) 
    SET @Row = SubString(@XMLString, @RowStart, @[email protected]) 
    SET @JSON = @JSON+'{' 

    -- for each row 
    SET @FieldStart = CharIndex(@StartField, @Row, 0) 
    WHILE @FieldStart &gt; 0 
    BEGIN 
     -- parse node key 
     SET @FieldStart = @FieldStart+Len(@StartField) 
     SET @FieldEnd = CharIndex(@EndField, @Row, @FieldStart) 
     SET @Key = SubString(@Row, @FieldStart, @[email protected]) 
     SET @JSON = @JSON+'"'[email protected]+'":' 

     -- parse node value 
     SET @FieldStart = @FieldEnd+1 
     SET @FieldEnd = CharIndex('0 SET @JSON = SubString(@JSON, 0, LEN(@JSON)) 
    SET @JSON = @JSON+'},' 
    --/ for each row 

    SET @RowStart = CharIndex(@StartRoot, @XMLString, @RowEnd) 
END 
IF LEN(@JSON) > 0 SET @JSON = SubString(@JSON, 0, LEN(@JSON)) 
SET @JSON = '[' + @JSON + ']' 
SELECT @JSON 
END 
+0

此方法的问题/限制是结果仅限于@JSON varchar(max)字符串限制。所以当结果变大时,结果开始被截断。 – 2013-02-14 17:30:57

+0

顺便说一句,谢谢你的回答,即使我无法使用它! – 2013-02-14 23:45:53