【poj3693-重复次数最多的连续重复子串】后缀数组

题意:给定一个串,长度<=10^5,求它重复次数最多的连续重复子串(输出字典序最小的那个)。

例如ccabcabc,答案就是abcabc

【poj3693-重复次数最多的连续重复子串】后缀数组

一开始没想清楚,结果调了好久。

原理:

【poj3693-重复次数最多的连续重复子串】后缀数组

按照L划分,因为相邻两个i之间隔着一个L,s[i*L]和s[(i+1)*L]必定是真正循环节的同一个位置。

对于当前的L,i,i+1,x=s[i*L],y=s[(i+1)*L],找前找后,知道了最早能匹配到t0,最晚能匹配到t1,因为不知道当前的起始点是真正循环节的第几个点,所以我们要往前找L个点看看它们是不是真正的起始点。

细节就看代码吧:

#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<iostream>
using namespace std; const int N=*;
int cl,rk[N],sa[N],Rs[N],y[N],wr[N],h[N],r[N][];
char c[N]; int minn(int x,int y){return x<y ? x:y;} void get_sa(int m)
{
for(int i=;i<=cl;i++) rk[i]=c[i]-'a'+;
for(int i=;i<=m;i++) Rs[i]=;
for(int i=;i<=cl;i++) Rs[rk[i]]++;
for(int i=;i<=m;i++) Rs[i]+=Rs[i-];
for(int i=cl;i>=;i--) sa[Rs[rk[i]]--]=i; int ln=,p=;
while(p<cl)
{
int k=;
for(int i=cl-ln+;i<=cl;i++) y[++k]=i;
for(int i=;i<=cl;i++) if(sa[i]>ln) y[++k]=sa[i]-ln; for(int i=;i<=cl;i++) wr[i]=rk[y[i]];
for(int i=;i<=m;i++) Rs[i]=;
for(int i=;i<=cl;i++) Rs[wr[i]]++;
for(int i=;i<=m;i++) Rs[i]+=Rs[i-];
for(int i=cl;i>=;i--) sa[Rs[wr[i]]--]=y[i]; for(int i=;i<=cl;i++) wr[i]=rk[i];
for(int i=cl+;i<=cl+ln;i++) wr[i]=;
p=;rk[sa[]]=;
for(int i=;i<=cl;i++)
{
if(wr[sa[i]]!=wr[sa[i-]] || wr[sa[i]+ln]!=wr[sa[i-]+ln]) p++;
rk[sa[i]]=p;
}
ln*=,m=p;
}
sa[]=,rk[]=;
} void get_h()
{
int k=,j;
for(int i=;i<=cl;i++) if(rk[i]!=)
{
j=sa[rk[i]-];
if(k) k--;
while(c[j+k]==c[i+k] && j+k<=cl && i+k<=cl) k++;
h[rk[i]]=k;
}
h[]=;
} void get_rmq()
{
for(int i=;i<=cl;i++) r[i][]=h[i];
for(int j=;(<<j)<=cl;j++)
for(int i=;i+(<<j)-<=cl;i++)
{
r[i][j]=minn(r[i][j-],r[i+(<<(j-))][j-]);
}
} int query_rmq(int i,int j)
{
if(i>j) swap(i,j);
i++;
int k=;
while(i+(<<(k+)) <= j) k++;
return minn(r[i][k],r[j-(<<k)+][k]);
} int main()
{
int x,y,z,t0,t1,now,ans,al,ar,T=;
while()
{
scanf("%s",c+);
cl=strlen(c+);
if(cl== && c[]=='#') return ;
printf("Case %d: ",++T);
get_sa();
get_h();
get_rmq();
ans=;al=ar=;
for(int L=;L*<=cl;L++)
{
for(int i=;L*(i+)+<=cl;i++)
{
x=L*i+,y=L*(i+)+;
if(c[x]!=c[y]) continue;
z=query_rmq(rk[x],rk[y]);
t1=y+z-;
t0=;
for(int j=;j<=L-;j++)//往前匹配
{
if(x-j< || c[x-j]!=c[y-j]) break;
t0=x-j;
now=((t1-t0+)/L);
if(now>ans || (now==ans && rk[t0]<rk[al])) ans=now,al=t0,ar=t0+now*L-;
}
}
}
if(ans==) printf("%c\n",c[sa[]]);
else
{
for(int i=al;i<=ar;i++) printf("%c",c[i]);printf("\n");
}
} return ;
}
上一篇:SqlServer环境配置和卸载


下一篇:POJ1743 Musical Theme —— 后缀数组 重复出现且不重叠的最长子串