17370845950

SQL分组统计操作教学_SQL GROUPBY与HAVING应用
SQL分组统计核心是GROUP BY配合聚合函数,HAVING用于筛选分组后的结果;WHERE在分组前过滤,HAVING在分组后过滤,且HAVING只能使用分组字段或聚合表达式。

SQL中的分组统计,核心靠 GROUP BY 搭配聚合函数(如 COUNT、SUM、AVG、MAX、MIN)实现;而 HAVING 是用来筛选“分组后”的结果,不是 WHERE——它不能直接写字段值,只能写分组字段或聚合表达式。

GROUP BY 基础用法:按字段归类再汇总

GROUP BY 把表中相同值的行归为一组,每组只返回一行统计结果。必须和聚合函数配合使用,SELECT 中所有非聚合字段都得出现在 GROUP BY 子句里。

  • ✅ 正确写法:SELECT dept, COUNT(*) FROM emp GROUP BY dept;
  • ❌ 错误写法:SELECT dept, name, COUNT(*) FROM emp GROUP BY dept;(name 没参与分组,也没聚合,报错)
  • 多个字段分组写成:GROUP BY dept, job,表示先按部门、再按岗位细分组

HAVING 筛选分组结果:WHERE 不能做的事交给它

WHERE 在分组前过滤原始行,HAVING 在分组后过滤“组”。比如想查“员工数超过5人的部门”,就得用 HAVING COUNT(*) > 5,因为 COUNT 是分组后才有的值。

  • ✅ 正确顺序:SELECT dept, COUNT(*) c FROM emp GROUP BY dept HAVING c > 5;
  • ❌ 不能写成 WHERE COUNT(*) > 5(语法错误,WHERE 不认识聚合函数)
  • HAVING 可以引用 SELECT 中的别名(如上面的 c),但部分数据库(如 MySQL 5.7 严格模式)可能不支持,稳妥起见建议重复写表达式:HAVING COUNT(*) > 5

常见组合技巧:带条件的分组统计

实际业务中常要“先过滤再分组”或“分组后多条件筛选”,注意 WHERE 和 HAVING 的分工:

  • 查各销售组中,2025年订单总额超10万的组:
    SELECT sales_team, SUM(amount) total FROM orders
      WHERE order_date >= '2025-01-01'
      GROUP BY sales_team
      HAVING SUM(amount) > 100000;
  • 统计每个用户最近3个月下单次数,只看下单≥2次的人:
    SELECT user_id, COUNT(*) FROM orders
      WHERE order_time >= DATE_SUB(NOW(), INTERVAL 3 MONTH)
      GROUP BY user_id
      HAVING COUNT(*) >= 2;

容易踩的坑提醒

初学 GROUP BY 最常卡在这几个地方:

  • SELECT 列表里漏写 GROUP BY 字段(尤其多字段分组时)
  • 把 HAVING 当 WHERE 用,比如写 HAVING salary > 5000(salary 是单行字段,不该在 HAVING 出现)
  • ORDER BY 想按聚合结果排序,却忘了加在最后:... HAVING ... ORDER BY COUNT(*) DESC
  • 空值(NULL)会被单独分到一组,COUNT(*) 会统计,但 COUNT(某列) 会忽略该列为 NULL 的行

基本上就这些。GROUP BY + HAVING 是 SQL 数据分析的基石操作,练熟几遍真实表结构,很快就能条件反射写出正确语句。