我用C程序怎么把汉字字串转换成十六进制形式的字符串
我用C程序怎么把汉字字串转换成十六进制形式的字符串例如:我输入汉字“四川省成都市双流县”得到字符串“56DB5DDD7701621090FD5E0253CC6D4153BF”(此为unicode UTF-8编码)
*******************汉字转unicode编码软件***************************
输入:四川省成都市双流县
输出:56DB 5DDD 7701 6210 90FD 5E02 53CC 6D41 53BF
*******************我现在用C语言程序实现此功能*********************
编译环境为Linux redhat gcc4.3.2
char geo_addr_utf8[100]="四川省成都市双流县";//为unicode UTF-8格式的汉字编码,geo_addr_utf8是从xml网页文件中提取出来的,内容是正确的。
strlen(geo_addr_utf8) = 27;//为什么长度为27个bytes,一个汉字两个字节,9个汉字应该是18个bytes才对?
for(i=0;i<strlen(geo_addr_utf8);i++)
{printf("%d,",geo_addr_utf8[i]);}printf("\n");
显示为:
-27,-101,-101,-27,-73,-99,-25,-100,-127,-26,-120,-112,-23,-125,-67,-27,-72,-126,-27,-113,-116,-26,-75,-127,-27,-114,-65,
for(i=0;i<strlen(geo_addr_utf8);i++)
{printf("0x%02X,",geo_addr_utf8[i]);}printf("\n");
显示为:
0xFFFFFFE5,0xFFFFFF9B,0xFFFFFF9B,0xFFFFFFE5,0xFFFFFFB7,0xFFFFFF9D,0xFFFFFFE7,0xFFFFFF9C,0xFFFFFF81,0xFFFFFFE6,0xFFFFFF88,0xFFFFFF90,0xFFFFFFE9,0xFFFFFF83,0xFFFFFFBD,0xFFFFFFE5,0xFFFFFFB8,0xFFFFFF82,0xFFFFFFE5,0xFFFFFF8F,0xFFFFFF8C,0xFFFFFFE6,0xFFFFFFB5,0xFFFFFF81,0xFFFFFFE5,0xFFFFFF8E,0xFFFFFFBF,
为什么显示出来都是四字节的十六进制,char为单字节数字吧
for(i=0;i<strlen(geo_addr_utf8);i++)
{printf("%C,",geo_addr_utf8[i]);}printf("\n");
显示为:
?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,,?,?,?,?,?,
这是怎么回事?
如何实现输入为geo_addr_utf8输出为geo_addr_HexString“56DB5DDD7701621090FD5E0253CC6D4153BF”
顺便问一下:Linux gcc默认编译的汉字为GB2312吧?