AC自動機_模板

AC自動機:

  • 求多個字符串是否在主串中出現(xiàn)過??梢罁?jù)情況分別求出出現(xiàn)次數(shù),出現(xiàn)位置等。

AC自動機入門
Keywords Search
指針多叉樹

#include<cstdio>
#include<cstring>
#include<iostream>
#include<queue>
using namespace std;
const int MAXN=4000010;
const int BASE=26;
struct Node
{
    Node *fail;
    Node *next[26];
    int cnt;
    void init()
    {
        fail=NULL;
        memset(next,NULL,sizeof(next));
        cnt=0;
    }
};
Node *root;
void put(char *str)
{
    Node *p=root;
    int len=strlen(str);
    for(int i=0;i<len;i++)
    {
        int pos=str[i]-'a';
        if(p->next[pos]==NULL)
        {
            p->next[pos]=new Node();
            p->next[pos]->init();
            p=p->next[pos];
        }
        else p=p->next[pos];
    }
    p->cnt++;//題目含有重復模式串
}
void getFail()
{
    queue<Node *>que;
    Node *temp,*son,*p=root;
    que.push(p);
    while(!que.empty())
    {
        Node *curr=que.front();
        que.pop();
        for(int i=0;i<26;i++)
        {
            son=curr->next[i];
            if(son!=NULL)
            {
                if(curr==root)
                {
                    son->fail=root;
                }
                else
                {
                    p=curr->fail;
                    while(p!=NULL)
                    {
                        if(p->next[i]!=NULL)
                        {
                            son->fail=p->next[i];
                            break;
                        }
                        p=p->fail;
                    }
                    if(p==NULL) son->fail=root;
                }
                que.push(son);
            }
        }
    }
}
void query(char *str)
{
    int len=strlen(str);
    Node *p=root,*temp;
    int sum=0;
    for(int i=0;i<len;i++)
    {
        int pos=str[i]-'a';
        while(p->next[pos]==NULL&&p!=root) p=p->fail;
        p=p->next[pos];
        if(p==NULL) p=root;
        temp=p;
        while(temp!=root)
        {
            if(temp->cnt>=0)//這里直接把沒訪問過的節(jié)點設置為訪問狀態(tài),加速搜索(因為題目求的是出現(xiàn)過的模式串,只求一次)
            {
                sum+=temp->cnt;
                temp->cnt=-1;
            }
            else break;//節(jié)點已經(jīng)訪問過了,直接break 
            temp=temp->fail;
        }
    }
    printf("%d\n",sum);
}
int main()
{
    char str[1000000+100];
    int cas,n;
    scanf("%d",&cas);
    while(cas--)
    {
        root=new Node();
        root->init();
        scanf("%d",&n);
        int i;
        getchar();
        for(i=0;i<n;i++)
        {
            gets(str);
            put(str);
        }
        getFail();
        gets(str);
        query(str);
    }
    return 0;
}

數(shù)組多叉樹

#include<cstdio>
#include<cstring>
#include<iostream>
#include<queue>
using namespace std;
const int MAXN=4000010;
const int BASE=26;
struct Node
{
    int cnt;
    int fail;
    int next[26];
};
Node trie[MAXN];
int trie_s;
void insert(char *str)
{
    int len=strlen(str);
    int p=1;
    for(int i=0;i<len;i++)
    {
        int pos=str[i]-'a';
        if(!trie[p].next[pos])
        {
            trie[p].next[pos]=++trie_s;
            memset(trie[trie[p].next[pos]].next,0,sizeof(trie[trie[p].next[pos]].next));
            trie[trie[p].next[pos]].cnt=0;
            trie[trie[p].next[pos]].fail=0;
        }
        p=trie[p].next[pos];
    }
    trie[p].cnt++;
}
void getFail()
{
    queue<int> que;
    int son,p=1,temp;
    que.push(p);
    while(!que.empty())
    {
        int curr=que.front();
        que.pop();
        for(int i=0;i<26;i++)
        {
            son=trie[curr].next[i];
            if(son)
            {
                if(curr==1) trie[son].fail=1;
                else
                {
                    temp=trie[curr].fail;
                    while(temp!=0)
                    {
                        if(trie[temp].next[i])
                        {
                            trie[son].fail=trie[temp].next[i];
                            break;
                        }
                        temp=trie[temp].fail;
                    }
                    if(temp==0) trie[son].fail=1;
                }
                que.push(son);
            }
        }
    }
}
void query(char *str)
{
    int cnt=0;
    int len=strlen(str);
    int p=1,temp;
    for(int i=0;i<len;i++)
    {
        int pos=str[i]-'a';
        while(!trie[p].next[pos]&&p!=1) p=trie[p].fail;
        p=trie[p].next[pos];
        if(!p) p=1;
        temp=p;
        while(temp!=1)
        {
            if(trie[temp].cnt>=0)//
            {
                cnt+=trie[temp].cnt;
                trie[temp].cnt=-1;
            }
            else break;
            temp=trie[temp].fail;
        }
    }
    printf("%d\n",cnt);
}
int main()
{
    char str[1000000+100];
    int cas,n;
    scanf("%d",&cas);
    while(cas--)
    {
        trie_s=1;
        trie[1].cnt=0;
        trie[1].fail=0;
        memset(trie[1].next,0,sizeof(trie[1].next));
        scanf("%d",&n);
        int i;
        getchar();
        for(i=0;i<n;i++)
        {
            gets(str);
            insert(str);
        }
        getFail();
        gets(str);
        query(str);
    }
    return 0;
}

病毒侵襲持續(xù)中
指針多叉樹

#include<cstdio>
#include<cstring>
#include<queue>
using namespace std;
const int MAXN=1010;
char virus[MAXN][55];
int num[MAXN];
struct Node
{
    Node *fail;
    Node *next[28];
    int id;
    void init()
    {
        id=-1;
        fail=NULL;
        memset(next,NULL,sizeof(next));
    }
};
Node *root;
void insert(char *str,int id)
{
    int len=strlen(str);
    Node *p=root;
    for(int i=0;i<len;i++)
    {
        int pos=str[i]-'A';
        if(p->next[pos]==NULL)
        {
            p->next[pos]=new Node();
            p->next[pos]->init();
        }
        p=p->next[pos];
    }
    p->id=id;
}
void getFail()
{
    Node *temp,*son,*p=root;
    queue<Node *> que;
    que.push(p);
    while(!que.empty())
    {
        Node *curr=que.front();
        que.pop();
        for(int i=0;i<28;i++ )
        {
            son=curr->next[i];
            if(son!=NULL)
            {
                if(curr==root) son->fail=root;
                else
                {
                    temp=curr->fail;
                    while(temp!=NULL)
                    {
                        if(temp->next[i]!=NULL)
                        {
                            son->fail=temp->next[i];
                            break;
                        }
                        temp=temp->fail;
                    }
                    if(temp==NULL) son->fail=root;
                }
                que.push(son);
            }
        }
    }
}
void query(char *str)
{
    int len=strlen(str);
    Node *p=root,*temp;
    for(int i=0;i<len;i++)
    {
        int pos=str[i]-'A';
        if(pos<0||pos>26) pos=27;
        while((p->next[pos]==NULL)&&p!=root) p=p->fail;
        p=p->next[pos];
        if(p==NULL) p=root;
        temp=p;
        while(temp!=root)
        {
            if(temp->id!=-1)//這里只查詢是病毒尾的節(jié)點;
            {
                num[temp->id]++;
            }
            temp=temp->fail;
        }
    }
}
int main()
{
    char str[2000000+100];
    int n;
    while(scanf("%d",&n)!=EOF)
    {
        root=new Node();
        root->init();
        for(int i=1;i<=n;i++)
        {
            scanf("%s",virus[i]);
            insert(virus[i],i);
            num[i]=0;
        }
        getFail();
        getchar();
        gets(str);
        query(str);
        for(int i=1;i<=n;i++)
        {
            if(num[i]) printf("%s: %d\n",virus[i],num[i]);
        }
    }
    return 0;
}

數(shù)組多叉樹
填坑,待補充
填坑,待補充
填坑,待補充

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容