unicode 最新版本是2009年9月出版的5.2版,对汉字又进行了扩充。以往常说的20902个汉字,在unicode中从0x4e00-0x9fa5,但这不是全部的unicode汉字。最新版的unicode汉字块如下:
0x4E00-0x9FFF CJK 统一字型 常用字 共 20992个(实际只定义到0x9FCB)
0x3400-0x4DFF CJK 统一字型扩展表A 少用字 共 6656个 (实际定义到4DB5 䶵 字)
0x20000-0x2A6DF CJK 统一字型扩展表B 少用字,历史上使用 共42720个 (实际定义到0x2A6D6
所以把上面个的16进制数字打印为字符就可以了。
package javabasic;
public class ChineseUnicode
{
public static void main(String[] args)
{
/*
0x4E00-0x9FFF CJK 统一字型 常用字 共 20992个(实际只定义到0x9FCB)
0x3400-0x4DFF CJK 统一字型扩展表A 少用字 共 6656个 (实际定义到4DB5 䶵 字)
0x20000-0x2A6DF CJK 统一字型扩展表B 少用字,历史上使用 共42720个 (实际定义到0x2A6D6
*/
StringBuffer chineseLink = new StringBuffer();
for (int i = new Integer(0x4E00); i <= new Integer(0x9FFF); i++)
{
chineseLink.append((char)i).append(", ");
}
for (int i = new Integer(0x3400); i <= new Integer(0x4DFF); i++)
{
chineseLink.append((char)i).append(", ");
}
for (int i = new Integer(0x20000); i <= new Integer(0x2A6DF); i++)
{
chineseLink.append((char)i).append(", ");
}
System.out.println(chineseLink);
}
}