通八洲科技

Python中高效合并多个字典相同键的列表值

日期:2025-12-13 00:00 / 作者:花韻仙語

本文旨在介绍如何高效且pythonic地合并多个字典,特别是当这些字典拥有相同的键,且键对应的值是需要合并的列表时。我们将详细探讨使用`collections.defaultdict`结合`list.extend()`方法,提供一种简洁、强大的解决方案,以避免常见的合并误区,并确保正确地聚合所有相关列表数据。

解决字典列表值合并问题

在Python编程中,我们经常会遇到需要合并多个字典的场景。一个常见的需求是,当多个字典拥有相同的键,但这些键对应的值是列表,并且我们希望将这些列表值进行合并(即连接)而非简单覆盖时。

例如,考虑以下两个字典:

dict_1 = {"a": ["1"], "b": ["3"]}
dict_2 = {"a": ["2"], "b": ["3"]}

我们期望的合并结果是:

new_dict = {'a': ["1", "2"], 'b': ["3", "3"]}

然而,如果仅仅使用Python 3.5+的字典合并语法,如 merged_dict = {**dict_1, **dict_2},结果将是 {'a': ['2'], 'b': ['3']}。这是因为后面的字典会覆盖前面字典中相同的键,而不是合并其值。对于列表值合并的需求,我们需要一种更精细的方法。

使用 collections.defaultdict 进行高效合并

Python标准库中的 collections 模块提供了一个名为 defaultdict 的工厂函数,它非常适合解决这类问题。defaultdict 的一个主要特点是,当访问一个不存在的键时,它会自动调用工厂函数来生成一个默认值。

对于我们的场景,我们可以将 list 作为 defaultdict 的工厂函数。这意味着,每当我们尝试访问一个新键时,defaultdict 会自动为该键创建一个空列表。然后,我们可以利用列表的 extend() 方法将来自不同字典的列表值追加到这个默认创建的列表中。

以下是实现此功能的Pythonic方法:

from collections import defaultdict

# 示例输入字典
dict_1 = {"a": ["1"], "b": ["3"]}
dict_2 = {"a": ["2"], "b": ["3"]}
dict_3 = {"a": ["4", "5"], "c": ["6"]} # 增加一个字典以展示多字典合并

# 初始化一个defaultdict,默认值为list
merged_dict = defaultdict(list)

# 遍历所有需要合并的字典
for d in [dict_1, dict_2, dict_3]:
    # 遍历当前字典中的所有键值对
    for key, value in d.items():
        # 使用extend方法将当前字典的列表值添加到merged_dict中对应键的列表中
        merged_dict[key].extend(value)

# 将defaultdict转换为普通字典(可选,如果后续操作不需要defaultdict特性)
final_dict = dict(merged_dict)

print(final_dict)

输出结果:

{'a': ['1', '2', '4', '5'], 'b': ['3', '3'], 'c': ['6']}

代码解析

  1. from collections import defaultdict: 导入 defaultdict 类。
  2. merged_dict = defaultdict(list): 创建一个 defaultdict 实例。当尝试访问 merged_dict 中不存在的键时,它会自动为该键创建一个空列表作为其值。
  3. for d in [dict_1, dict_2, dict_3]:: 这是一个外部循环,用于迭代所有需要合并的输入字典。
  4. for key, value in d.items():: 这是一个内部循环,用于遍历当前字典 d 中的每一个键值对。
  5. merged_dict[key].extend(value): 这是核心操作。
    • merged_dict[key]:如果 key 第一次被访问,defaultdict 会自动为它创建一个空列表。如果 key 已经存在,则直接获取其关联的列表。
    • .extend(value):extend() 方法用于将一个可迭代对象(在这里是 value,它本身是一个列表)中的所有元素添加到当前列表的末尾。这与 append() 不同,append() 会将整个 value 列表作为一个单一元素添加到当前列表。extend() 正是我们所需的列表合并操作。

为什么 defaultdict 是一个Pythonic且高效的选择?

注意事项

总结

当需要合并多个字典中相同键的列表值时,collections.defaultdict 结合 list.extend() 提供了一种优雅、高效且符合Pythonic风格的解决方案。它避免了手动管理键是否存在和列表初始化的复杂性,使代码更加简洁、健壮,并能轻松处理任意数量的输入字典。掌握这种模式对于处理复杂数据聚合任务的Python开发者来说至关重要。