求助: 编码-如何区分 [ANSI] 和 [无BOM的UTF8] 这两种编码
编码-如何区分 [ANSI] 和 [无BOM的UTF8] 这两种编码ANSI 936 GBK 2个字节 表示一个汉字。
无BOM的UTF8 3个字节 表示一个汉字。
C++如何区分 文本文件是GBK还是无BOM的UTF8
不要告诉我显示出来,看是不是乱码就知道了。。。。
UTF-8 用一到四个字节表示字符。 一个字节:0******* (7位) 两个字节:110***** 10****** (11位) 三个字节:1110**** 10****** 10****** (16位) 四个字节:11110*** 10****** 10****** 10****** (21位) 以此类推,理论上最多能到六个字节(第一个字节已经是1111110*),但由于Unicode范围是U+0000到U+10FFFF(0x10FFFF=十进制1114111=长21位的二进制10000 11111111 11111111),所以最多四个字节足矣。
[此贴子已经被作者于2022-9-11 20:57编辑过]