【问题标题】:How can I return pivot table output in MySQL?如何在 MySQL 中返回数据透视表输出?
【发布时间】:2011-12-02 06:03:36
【问题描述】:

如果我的 MySQL 表看起来像这样:

company_name 操作页数 ------------------------------------------- 公司 A 打印 3 公司 A 打印 2 公司 A 打印 3 B公司邮箱 公司 B 打印 2 公司 B 打印 2 公司 B 打印 1 公司 A 打印 3

是否可以运行 MySQL 查询以获得如下输出:

company_name EMAIL 打印 1 页 打印 2 页 打印 3 页 -------------------------------------------------- ------------ A公司 0 0 1 3 B公司 1 1 2 0

这个想法是 pagecount 可以变化,因此输出列的数量应该反映这一点,每个 action/pagecount 对对应一列,然后每个 company_name 的命中数。我不确定这是否称为数据透视表,但有人建议这样做?

【问题讨论】:

  • 这称为旋转,在 SQL 之外进行这种转换要快得多。
  • Excel 会处理这样的事情,在 MySQL 中真的很难,因为没有“CROSSTAB”运算符 :(
  • 是的,它目前是在 Excel 中手动完成的,我们正在尝试将其自动化。
  • @N.B.是建议在我们的应用层执行它还是在我们的应用层执行它更简单?
  • @giannischristofakis - 这真的取决于你和你的同事认为什么更简单。自从我发表评论(4 年)以来,技术已经赶上了很多,所以它完全取决于你觉得更好 - 无论是在应用程序还是 SQL 中。例如,在我的工作中,我们处理类似的问题,但我们将 SQL 和应用内方法结合起来。基本上,除了给出固执己见的答案之外,我无能为力,这不是你所需要的:)

标签: mysql sql pivot


【解决方案1】:

这基本上一个数据透视表。

可以在此处找到有关如何实现此目的的精彩教程:http://www.artfulsoftware.com/infotree/qrytip.php?id=78

我建议阅读这篇文章并根据您的需求调整此解决方案。

更新

在上面的链接目前不再可用之后,我觉得有义务为所有在这里搜索 mysql pivot 答案的人提供一些额外的信息。它确实有大量的信息,我不会把那里的所有东西都放在这里(甚至更多,因为我只是不想复制他们的大量知识),但我会就如何处理枢轴提供一些建议用首先提出问题的 peku 的示例来概括 sql 方式。

也许链接很快就会恢复,我会留意它。

电子表格方式...

许多人只是为此目的使用 MSExcel、OpenOffice 或其他电子表格工具等工具。这是一个有效的解决方案,只需复制那里的数据并使用 GUI 提供的工具来解决这个问题。

但是...这不是问题所在,它甚至可能导致一些缺点,例如如何将数据放入电子表格、有问题的缩放等等。

SQL 方式...

鉴于他的桌子看起来像这样:

CREATE TABLE `test_pivot` (
  `pid` bigint(20) NOT NULL AUTO_INCREMENT,
  `company_name` varchar(32) DEFAULT NULL,
  `action` varchar(16) DEFAULT NULL,
  `pagecount` bigint(20) DEFAULT NULL,
  PRIMARY KEY (`pid`)
) ENGINE=MyISAM;

现在查看他/她想要的表:

company_name    EMAIL   PRINT 1 pages   PRINT 2 pages   PRINT 3 pages
-------------------------------------------------------------
CompanyA        0       0               1               3
CompanyB        1       1               2               0

行(EMAILPRINT x pages)类似于条件。主要分组是company_name

为了设置条件,这需要使用CASE-statement。为了按某事分组,好吧,使用... GROUP BY

提供此数据透视的基本 SQL 可能如下所示:

SELECT  P.`company_name`,
    COUNT(
        CASE 
            WHEN P.`action`='EMAIL' 
            THEN 1 
            ELSE NULL 
        END
    ) AS 'EMAIL',
    COUNT(
        CASE 
            WHEN P.`action`='PRINT' AND P.`pagecount` = '1' 
            THEN P.`pagecount` 
            ELSE NULL 
        END
    ) AS 'PRINT 1 pages',
    COUNT(
        CASE 
            WHEN P.`action`='PRINT' AND P.`pagecount` = '2' 
            THEN P.`pagecount` 
            ELSE NULL 
        END
    ) AS 'PRINT 2 pages',
    COUNT(
        CASE 
            WHEN P.`action`='PRINT' AND P.`pagecount` = '3' 
            THEN P.`pagecount` 
            ELSE NULL 
        END
    ) AS 'PRINT 3 pages'
FROM    test_pivot P
GROUP BY P.`company_name`;

这应该会很快提供所需的结果。这种方法的主要缺点是,您希望数据透视表中的行越多,您需要在 SQL 语句中定义的条件就越多。

这也可以处理,因此人们倾向于使用准备好的语句、例程、计数器等。

有关此主题的一些附加链接:

【讨论】:

【解决方案2】:

我的解决方案是在 T-SQL 中,没有任何枢轴:

SELECT
    CompanyName,  
    SUM(CASE WHEN (action='EMAIL') THEN 1 ELSE 0 END) AS Email,
    SUM(CASE WHEN (action='PRINT' AND pagecount=1) THEN 1 ELSE 0 END) AS Print1Pages,
    SUM(CASE WHEN (action='PRINT' AND pagecount=2) THEN 1 ELSE 0 END) AS Print2Pages,
    SUM(CASE WHEN (action='PRINT' AND pagecount=3) THEN 1 ELSE 0 END) AS Print3Pages
FROM 
    Company
GROUP BY 
    CompanyName

【讨论】:

  • 即使在 PostgreSQL 上也适用于我。我更喜欢这种方法而不是在 Postgres 上使用交叉表扩展,因为这是 cleaner
  • “我的解决方案是在 T-SQL 中,没有任何枢轴:” 不仅是 SQL Server,它应该适用于大多数遵循 ANSI SQL 标准的数据库供应商。请注意,SUM() 只能使用数字数据,如果您需要旋转字符串,则必须使用 MAX()
  • 我认为 CASESUM(CASE WHEN (action='PRINT' AND pagecount=1) THEN 1 ELSE 0 END) 中是不必要的,你可以只做SUM(action='PRINT' AND pagecount=1) 因为条件将转换为1 时为真,0 时假
  • @kajacx 是的,尽管在没有那种布尔操作的数据库上需要它。如果在“适用于所有 dB 的较长语法”和“仅适用于...的较短语法”之间进行选择,我会选择前者
【解决方案3】:
select t3.name, sum(t3.prod_A) as Prod_A, sum(t3.prod_B) as Prod_B, sum(t3.prod_C) as    Prod_C, sum(t3.prod_D) as Prod_D, sum(t3.prod_E) as Prod_E  
from
(select t2.name as name, 
case when t2.prodid = 1 then t2.counts
else 0 end  prod_A, 

case when t2.prodid = 2 then t2.counts
else 0 end prod_B,

case when t2.prodid = 3 then t2.counts
else 0 end prod_C,

case when t2.prodid = 4 then t2.counts
else 0 end prod_D, 

case when t2.prodid = "5" then t2.counts
else 0 end prod_E

from 
(SELECT partners.name as name, sales.products_id as prodid, count(products.name) as counts
FROM test.sales left outer join test.partners on sales.partners_id = partners.id
left outer join test.products on sales.products_id = products.id 
where sales.partners_id = partners.id and sales.products_id = products.id group by partners.name, prodid) t2) t3

group by t3.name ;

【讨论】:

    【解决方案4】:

    对于 MySQL,您可以直接将条件放在 SUM() 函数中,它将被评估为布尔值 01,因此您可以根据您的条件进行计数,而无需使用 @ 987654327@语句

    SELECT
        company_name,  
        SUM(action = 'EMAIL')AS Email,
        SUM(action = 'PRINT' AND pagecount = 1)AS Print1Pages,
        SUM(action = 'PRINT' AND pagecount = 2)AS Print2Pages,
        SUM(action = 'PRINT' AND pagecount = 3)AS Print3Pages
    FROM t
    GROUP BY company_name
    

    DEMO

    【讨论】:

    • 这是一个非常整洁的。您知道这是否符合其他平台(如 Postgres)的标准?
    • @itsols 没有它只适用于 Mysql 特定
    • @itsols:我添加了另一个standard SQL version。 Postgres 还有一个dedicated crosstab() function.
    • 也适用于 SQLite
    • 这就是我要找的……真的很棒
    【解决方案5】:

    对于动态枢轴,使用GROUP_CONCATCONCATGROUP_CONCAT 函数将一组字符串连接成一个带有各种选项的字符串。

    SET @sql = NULL;
    SELECT
        GROUP_CONCAT(DISTINCT
        CONCAT(
          'SUM(CASE WHEN action = "',
          action,'"  AND ', 
               (CASE WHEN pagecount IS NOT NULL 
               THEN CONCAT("pagecount = ",pagecount) 
               ELSE pagecount IS NULL END),
          ' THEN 1 ELSE 0 end) AS ',
          action, IFNULL(pagecount,'')
    
        )
      )
    INTO @sql
    FROM
      t;
    
    SET @sql = CONCAT('SELECT company_name, ', @sql, ' 
                      FROM t 
                       GROUP BY company_name');
    
    PREPARE stmt FROM @sql;
    EXECUTE stmt;
    DEALLOCATE PREPARE stmt;
    

    DEMO HERE

    【讨论】:

    • Pacerier,真正的男人,但动态旋转是最好的方法之一
    • 如果您在“操作”列中有许多值或期望该列表随着时间的推移而增长,这很有效,因为为每个值编写案例语句可能很耗时且难以保持最新状态.
    【解决方案6】:

    使用boolean logic标准SQL版本:

    SELECT company_name
         , COUNT(action = 'EMAIL' OR NULL) AS "Email"
         , COUNT(action = 'PRINT' AND pagecount = 1 OR NULL) AS "Print 1 pages"
         , COUNT(action = 'PRINT' AND pagecount = 2 OR NULL) AS "Print 2 pages"
         , COUNT(action = 'PRINT' AND pagecount = 3 OR NULL) AS "Print 3 pages"
    FROM   tbl
    GROUP  BY company_name;
    

    SQL Fiddle.

    怎么做?

    TRUE OR NULL 产生TRUE
    FALSE OR NULL 产生NULL
    NULL OR NULL 产生NULL
    COUNT 只计算非空值。瞧。

    【讨论】:

    • @Erwin,但是你怎么知道有三列?如果有5个呢? 10? 20?
    • @Pacerier:问题中的示例似乎表明了这一点。无论哪种方式,SQL 要求 知道返回类型。 完全动态查询是不可能的。如果输出列的数量可以变化,您需要两个步骤:第一个构建查询,第二个:执行它。
    【解决方案7】:

    有一个名为 MySQL Pivot table generator 的工具,它可以帮助您创建基于 Web 的数据透视表,您可以稍后将其导出到 excel(如果您喜欢)。如果您的数据在单个表或多个表中,它可以工作。

    您需要做的就是指定列的数据源(它支持动态列),行,表体中的值和表关系(如果有的话)

    这个工具的主页是http://mysqlpivottable.net

    【讨论】:

      【解决方案8】:

      正确答案是:

      select table_record_id,
      group_concat(if(value_name='note', value_text, NULL)) as note
      ,group_concat(if(value_name='hire_date', value_text, NULL)) as hire_date
      ,group_concat(if(value_name='termination_date', value_text, NULL)) as termination_date
      ,group_concat(if(value_name='department', value_text, NULL)) as department
      ,group_concat(if(value_name='reporting_to', value_text, NULL)) as reporting_to
      ,group_concat(if(value_name='shift_start_time', value_text, NULL)) as shift_start_time
      ,group_concat(if(value_name='shift_end_time', value_text, NULL)) as shift_end_time
      from other_value
      where table_name = 'employee'
      and is_active = 'y'
      and is_deleted = 'n'
      GROUP BY table_record_id
      

      【讨论】:

      • 这只是您手头的一个例子吗? other_value 表的结构是什么?
      • “正确答案是:” 很可能不是,因为它缺少 SET 查询来增加默认值,该值在 1024 GROUP_CONCAT 被截断后限制为 1024 GROUP_CONCAT没有错误的字符串意味着可能会发生意外结果..
      • 抱歉,伙计们不记得更多细节了。我做一些有趣的事情,然后忘记或破坏整个项目。但是当我偶然遇到一个挑战时,我会分享我是如何解决它的。我知道我的例子不是很详细,但我想它可能会为那些知道他们要面对什么的人指明方向:)
      【解决方案9】:

      一种选择是结合在 MySQL 数据库的聚合中使用 CASE..WHEN 语句是多余的,并考虑所需的动态查询生成 以及为结果集获取正确的列标题,如以下代码块所示:

      SET @sql = NULL;
      
      SELECT GROUP_CONCAT(
                   CONCAT('SUM( `action` = ''', action, '''',pc0,' ) AS ',action,pc1)
             )
        INTO @sql
        FROM 
        ( 
         SELECT DISTINCT `action`, 
                IF(`pagecount` IS NULL,'',CONCAT('page',`pagecount`)) AS pc1,
                IF(`pagecount` IS NULL,'',CONCAT(' AND `pagecount` = ', pagecount, '')) AS pc0
           FROM `tab` 
          ORDER BY CONCAT(action,pc0) 
        ) t;
      
      SET @sql = CONCAT('SELECT company_name,',@sql,' FROM `tab` GROUP BY company_name'); 
      SELECT @sql; 
      
      PREPARE stmt FROM @sql;
      EXECUTE stmt;
      DEALLOCATE PREPARE stmt;
      

      Demo

      【讨论】:

        【解决方案10】:
        SELECT company_name, SUM(CASE WHEN ACTION = 'Email' THEN 1 ELSE 0 END) AS "Email",
        SUM(CASE WHEN ACTION = 'Print' AND pagecount = 1 THEN 1 ELSE 0 END) AS "print 1 PAGE",
        SUM(CASE WHEN ACTION = 'Print' AND pagecount = 2 THEN 1 ELSE 0 END) AS "print 2 PAGE",
        SUM(CASE WHEN ACTION = 'Print' AND pagecount = 3 THEN 1 ELSE 0 END) AS "print 2 PAGE"
        FROM test1 GROUP BY company_name;
        

        【讨论】:

          猜你喜欢
          相关资源
          最近更新 更多