数据的非规范化处理(Denormalized Data) #184

AlexiaChen · 2024-09-25T04:01:27Z

起因是这样的，公司一个同事提了一个问题，说是MongoDB性能差，对一些时序数据做分析，要跨表查询。估计后面要生成报表啥的吧。我也不清楚。我推荐现在性能好可以用ClickHouse，我说ClickHouse这种专业的OLAP数据库，一张大宽表，不用跨表查。他说他的数据是有关联性的，对JOIN有需求，我直觉上觉得可以把关联数据处理成一张表，但是当时我没有给出来相关的方法，毕竟我以前没有做过大数据。至于直觉为什么是这样，是因为，我在知乎上好像看到有人问ClickHouse JOIN相关的问题，大部分人回答说这是OLAP数据库的使用姿势不对，一般来说就是一张大表，几万列。直接避免JOIN。本来大数据这种就不推荐JOIN。所以我就想着几万列不可能没有关联数据，肯定是做了一些处理。今天同事开会又提到，刚好被我听见了，我就查了下，顺腾摸瓜。查出来这种把关联数据处理成一张表的方式叫Data Denormalization

当然，以前上一些看过一些关系型的数据库，也有这种手法，就是设计表的时候故意不遵循范式（比如让多个表的读取量大的字段重复，这样避免跨表查询），叫反范式设计。我发现其实都是一样的，并没有区别。

References

AlexiaChen added the 数据库数据库理论，以及使用，架构方案等 label Sep 25, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

数据的非规范化处理(Denormalized Data) #184

数据的非规范化处理(Denormalized Data) #184

AlexiaChen commented Sep 25, 2024 •

edited

Loading

数据的非规范化处理(Denormalized Data) #184

数据的非规范化处理(Denormalized Data) #184

Comments

AlexiaChen commented Sep 25, 2024 • edited Loading

References

AlexiaChen commented Sep 25, 2024 •

edited

Loading