汉字词语切分
要求从一个txt文件中读出汉字,统计其中的词语词频。我现在连汉字切分算法都不会,哪位大哥给个算法,有源程序最好了。谢谢了哈!
#include <iostream>
using namespace std;
int main()
{
char a[3][80];
int i,j;
int daxie=0,xiaoxie=0,number=0,space=0,other=0;
for (i=0;i<3;i++)
{
cout<<"输入文字"<<i+1<<endl;
gets(a[i]);
for (j=0;j<80 && a[i][j]!='\0';j++)
{
if (a[i][j]>='A' && a[i][j]<='Z')
{
daxie++;
}
else if (a[i][j]>='a' && a[i][j]<='z')
{
xiaoxie++;
}
else if (a[i][j]>='0' && a[i][j]<='9')
{
number++;
}
else if (a[i][j]==' ')
{
space++;
}
else
{
other++;
}
}
}
cout<<"大写字母有:"<<daxie<<endl;
cout<<"小写字母有:"<<xiaoxie<<endl;
cout<<"数字有:"<<number<<endl;
cout<<"空格有:"<<space<<endl;
cout<<"其他符号有:"<<other<<endl;
return 0;
}