正确写法是dd = defaultdict(lambda: defaultdict(int)),因defaultdict需可调用对象而非实例;三层及以上需逐层lambda嵌套,但推荐用递归函数nested_defaultdict避免可读性差和维护难。
直接写 defaultdict(defaultdict(int)) 会报错,因为 defaultdict 构造器需要一个可调用对象(callable),而 defaultdict(int) 是实例,不是类型或函数。正确做法是用 lambda 包一层:
dd = defaultdict(lambda: defaultdict(int)) —— 这是最常见的两层嵌套,访问 dd['a']['b'] 不会 KeyError,自动初始化为 0lambda 必须返回一个新实例,不能复用同一个 defaultdict(int) 对象,否则所有键共享同一内层字典lambda 直接传 defaultdict(int),会触发 TypeError: first argument must be callable
三层结构(如 dd[a][b][c])需要两层 lambda,因为每多一层,就多一个“缺省时该创建什么”的问题:
dd = defaultdict(lambda: defaultdict(lambda: defaultdi
ct(int)))defaultdict(lambda: defaultdict(lambda: defaultdict(lambda: defaultdict(int)))) —— 可读性迅速下降dd['x']['y']['z']['w']),前两层 key 缺失时分别触发对应 lambda,生成新的 defaultdict 实例setdefault() 显式控制当嵌套层数不确定或 ≥3 时,硬写 lambda 容易出错且难维护。改用普通函数更可控:
def nested_defaultdict(depth, factory=int):,内部递归构造 defaultdict
nested_defaultdict(3, list) 得到支持三层访问、末层默认为 [] 的结构lambda: nested_defaultdict(...) 时若未绑定参数,可能所有层级共用同一 factorylambda 可靠defaultdict 只在**单次下标访问缺失时触发一次默认工厂**,它不会帮你解析路径字符串或自动创建中间层级:
dd['a']['b']['c'] = 42 是合法的,前提是 dd 是两层以上嵌套,且每层都正确设了 lambda
dd[('a','b','c')] = 42 和 dd['a.b.c'] = 42 都只是单层 key,不会自动拆成嵌套结构defaultdict(dict) 能支持嵌套访问,实际会报 KeyError —— 因为 dict 不是可调用对象,且其本身不提供默认行为dd.a.b.c),得用 types.SimpleNamespace 或第三方库如 box,不是 defaultdict 的职责lambda 套娃越容易漏括号或写反顺序;实际项目中,三层以上几乎总是意味着数据建模可以扁平化,或者该用 JSON Schema + 验证逻辑来代替隐式默认行为。