c++怎么实现一个Trie树用于字符串查找_c++字典树数据结构构建与应用

答案:C++中Trie树通过节点逐层存储字符,支持高效插入、查找和前缀匹配。使用unordered_map管理子节点,插入时创建路径并标记结尾,查找需验证完整路径和结尾标志,前缀查询只需路径存在。适用于自动补全等场景,可扩展词频统计与字符串删除功能。

在C++中实现一个Trie树(又称字典树)可以高效地处理字符串的插入、查找和前缀匹配问题。相比哈希表,Trie不仅能避免哈希冲突,还能支持按字典序遍历和快速前缀搜索,非常适合用于自动补全、拼写检查、敏感词过滤等场景。

基本结构设计

Trie树的核心思想是将字符串按字符逐层存储,每个节点代表一个字符,从根到叶子的路径构成一个完整的字符串。每个节点需要维护指向子节点的指针,并标记是否为某个字符串的结尾。

使用std::unordered_map或数组来管理子节点。若仅处理小写字母,可用大小为26的数组;若字符集较大,推荐使用unordered_map7c>更灵活。

示例节点定义:

struct TrieNode {
    std::unordered_map children;
    bool isEndOfWord;

    TrieNode() : isEndOfWord(false) {}
};

插入字符串

从根节点开始,逐个处理字符串中的字符。如果当前字符对应的子节点不存在,则创建新节点。遍历完所有字符后,标记最后一个节点为单词结尾。

时间复杂度为O(n),n为字符串长度。

插入操作实现:

class Trie {
private:
    TrieNode* root;

public:
    Trie() {
        root = new TrieNode();
    }

    void insert(const std::string& word) {
        TrieNode* current = root;
        for (char ch : word) {
            if (current->children.find(ch) == current->children.end()) {
                current->children[ch] = new TrieNode();
            }
            current = current->children[ch];
        }
        current->isEndOfWord = true;
    }
};

查找字符串

查找过程与插入类似,沿着字符路径向下走。若中途某个字符找不到对应子节点,说明字符串不存在。若完整遍历完成,还需检查最后一个节点是否标记为单词结尾。

查找实现:

bool search(const std::string& word) {
    TrieNode* current = root;
    for (char ch : word) {
        if (current->children.find(ch) == current->children.end()) {
            return false;
        }
        current = current->children[ch];
    }
    return current->isEndOfWord;
}

判断前缀是否存在

前缀匹配不需要判断是否为完整单词,只要能顺着路径走完所有字符即可。

前缀查询实现:

bool startsWith(const std::string& prefix) {
    TrieNode* current = root;
    for (char ch : prefix) {
        if (current->children.find(ch) == current->children.end()) {
            return false;
        }
        current = current->children[ch];
    }
    return true;
}

整个Trie类封装后可直接使用。注意在实际项目中应考虑内存释放,可在析构函数中递归删除所有节点,防止内存泄漏。对于高频读写场景,还可加入引用计数或使用智能指针优化资源管理。

基本上就这些,结构清晰,扩展性强。根据需求还能添加统计词频、删除字符串、输出所有以某前缀开头的单词等功能。