用std::array因O(1)下标跳转、零分配、无扩容抖动;非ASCII字符可通过预处理、扩大数组或哈希映射应对;TrieNode只需bool is_end,避免冗余存储;search与startsWith语义不同需分别实现。
std::array 而不是 std::vector 存子节点前缀树的核心性能来自 O(1) 的字符跳转,std::array<:unique_ptr>, 26> 直接用 'a' - 'a' 算下标,避免哈希计算或遍历开销。用 std::vector 或 std::map 会把单次插入/查询从 O(L) 拉到平均 O(L·log 26) 甚至 O(L·26),尤其在大量短字符串(如单词、IP段)场景下差异明显。26 个字母是编译期确定大小,std::array 零分配、无动态扩容抖动。
硬编码 26 个槽只适用于纯小写英文。实际项目中常见三种应对方式:
std::tolower + std::isalpha 过滤,把输入转成小写再进树std::array<:unique_ptr>, 128>,直接按 ASCII 值索引,ch 作下标(需确保 ch )
std::unordered_map> ,牺牲常数时间换灵活性,适合 Unicod
e(需配合 std::u32string 和 char32_t 处理)多数日志关键词匹配、命令行自动补全等场景,选第一种最轻量;做多语言词典则倾向第三种。
TrieNode 必须带 is_end 标记,但别滥用 word 字段很多初学者会在每个节点存完整字符串(如 std::string word),这会导致内存爆炸——10 万个单词平均长 5 字符,重复前缀被存储上百次。正确做法是只在叶子或终止节点设 bool is_end = false,需要还原字符串时靠调用方传入路径栈(或递归参数)。若真要存词(如实现「以某前缀开头的所有词」接口),只在 is_end == true 的节点存一份 std::string_view(指向原始字符串池),避免拷贝。
struct TrieNode {
std::array, 26> children;
bool is_end = false;
};
class Trie {
std::unique_ptr root;
public:
Trie() : root(std::make_unique()) {}
void insert(const std::string& word) {
auto* node = root.get();
for (char c : word) {
int idx = c - 'a';
if (!node->children[idx]) {
node->children[idx] = std::make_unique();
}
node = node->children[idx].get();
}
node->is_end = true;
}
bool search(const std::string& word) {
auto* node = root.get();
for (char c : word) {
int idx = c - 'a';
if (!node->children[idx]) return false;
node = node->children[idx].get();
}
return node->is_end;
} };
insert 和 startsWith 共享路径查找逻辑,但语义隔离必须清晰
看似 startsWith 只是少判 is_end,但二者契约完全不同:search 要求路径存在且终点标记为词尾;startsWith 只要求路径存在(哪怕中途就断了也得返回 false)。不能简单复用 search 返回指针后判断是否为空——因为 search 中途遇到空子节点就 return false,而 startsWith 必须走完全部字符才下结论。易错点在于循环结束后不检查 node 是否为 null,而是直接返回 true。
另外,空字符串 "" 是合法前缀,但只有显式插入过 "" 才能被 search 命中,这点常被忽略。