PostgreSQL 中的条件超前/滞后函数
您有一个包含不同用户和时间戳的活动的表。您希望确定每个用户在 A 组中的最后一个活动,然后确定 B 组中的后续活动(如果有)。
使用引导函数
最初,您尝试使用lead()函数来解决这个问题。但是,lead() 函数本身不足以完成此任务,因为它只是按顺序检索下一个值,而不管任何条件。
条件窗口函数(FILTER)
为了有效地将条件应用于窗口函数,PostgreSQL 提供了 FILTER 子句。不幸的是,该子句目前尚未针对真正的窗口函数(如 Lead() 和 lag())实现,因为它仅适用于聚合函数。
使用 DISTINCT ON 的替代解决方案
为了在没有 FILTER 的情况下解决这一挑战,我们可以结合使用 DISTINCT ON 和 CASE 语句以及子查询:
SELECT name , CASE WHEN a2 LIKE 'B%' THEN a1 ELSE a2 END AS activity , CASE WHEN a2 LIKE 'B%' THEN a2 END AS next_activity FROM ( SELECT DISTINCT ON (name) name , lead(activity) OVER (PARTITION BY name ORDER BY time DESC) AS a1 , activity AS a2 FROM t WHERE (activity LIKE 'A%' OR activity LIKE 'B%') ORDER BY name, time DESC ) sub;
此方法利用 DISTINCT ON 子句按用户对行进行分组,并为每个用户从 A 组中选择最后一个符合条件的活动。 CASE 语句用于根据指定的条件确定适当的活动和后续活动。
大型数据集的最佳解决方案
对于涉及大量行的情况对于每个用户,替代技术可能更有效。这些技术通常涉及创建临时表或使用高级索引策略。但是,最佳方法可能会有所不同,具体取决于您的数据和工作负载的具体特征。
以上是如何在 PostgreSQL 中找到 A 组最后一个活动之后 B 组的后续活动?的详细内容。更多信息请关注PHP中文网其他相关文章!