| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 985 人关注过本帖
标题:汉字编码问题!
取消只看楼主 加入收藏
xiaobaisj
Rank: 1
等 级:新手上路
帖 子:74
专家分:0
注 册:2007-3-11
收藏
 问题点数:0 回复次数:11 
汉字编码问题!
来我再问一个问题,&#34430 这是什么汉字编码方式
还有就是怎么样转换成汉字呀,谢谢!
搜索更多相关主题的帖子: 汉字编码 
2007-04-17 15:49
xiaobaisj
Rank: 1
等 级:新手上路
帖 子:74
专家分:0
注 册:2007-3-11
收藏
得分:0 
看都没人看??我顶!
2007-04-17 16:35
xiaobaisj
Rank: 1
等 级:新手上路
帖 子:74
专家分:0
注 册:2007-3-11
收藏
得分:0 
谢谢斑竹。。。有没有具体点的呀,我是在一个网页中要提取一些东西,然后想把汉字也直接提取出来, 用什么函数可以把这些编码转换成汉字吗??
2007-04-18 08:19
xiaobaisj
Rank: 1
等 级:新手上路
帖 子:74
专家分:0
注 册:2007-3-11
收藏
得分:0 
StreamReader sr = new StreamReader("d:\\11.html", System.Text.Encoding.Default);
我试着写了这样的代码,开始不行。请斧正一下!
2007-04-18 08:30
xiaobaisj
Rank: 1
等 级:新手上路
帖 子:74
专家分:0
注 册:2007-3-11
收藏
得分:0 
不行 在文本文档里汉字的编码是这样的&#30828
但是我不知道这是什么编码方式。默认的编码方式也不行!
2007-04-18 10:14
xiaobaisj
Rank: 1
等 级:新手上路
帖 子:74
专家分:0
注 册:2007-3-11
收藏
得分:0 
我查了一下,他是iso-8859-1这样的编码方式,然后我就用
StreamReader sr = new StreamReader("d:\\11.html", Encoding.GetEncoding("iso-8859-1"));
string strHtml = sr.ReadToEnd();
来解码,可是还是不行,请指教!
2007-04-18 10:44
xiaobaisj
Rank: 1
等 级:新手上路
帖 子:74
专家分:0
注 册:2007-3-11
收藏
得分:0 
咳,郁闷这汉字搞的我头痛!继续顶,我再找找, 谢谢斑竹!
2007-04-18 10:50
xiaobaisj
Rank: 1
等 级:新手上路
帖 子:74
专家分:0
注 册:2007-3-11
收藏
得分:0 
对了,要是是unicode的编码方式的话,我要怎么实现汉字转换??
2007-04-18 11:25
xiaobaisj
Rank: 1
等 级:新手上路
帖 子:74
专家分:0
注 册:2007-3-11
收藏
得分:0 
是这样的,我现在有个 html格式的文件,里面有很多超连接,我现在要做的事把这些超连接提取出来,当然还包括这些连接的名字也就是title,但是我提取的时候呢,就遇到汉字转换不过来的问题,楼上的,你说的方法我也试过还是不行,
谢谢
2007-04-18 12:46
xiaobaisj
Rank: 1
等 级:新手上路
帖 子:74
专家分:0
注 册:2007-3-11
收藏
得分:0 

public static void TestToDe()
{
StreamReader sr = new StreamReader("d:\\11.html", Encoding.GetEncoding("gb2312"));

string strHtml = sr.ReadToEnd();

string p = @"<a\s+[^>]*href\s*=\s*(?:""(?<url>[^""]*)""|'(?<url>[^']*)'|(?<url>[^>^\s]+))[^/]*>(?<title>[^<>]*)<[/]?";
//@"\<a.*href\s*=\s*(?:""(?<url>[^""]*)""|'(?<url>[^']*)'|(?<url>[^\>^\s]+)).*\>(?<title>[^\<^\>]*)\<[^\</a\>]*/a\>";
// getBytes


Regex reg = new Regex(p, RegexOptions.IgnoreCase | RegexOptions.Compiled);
MatchCollection ms = reg.Matches(strHtml);

foreach (Match m in ms)
{
Console.WriteLine("{0}\n{1}\n\n", m.Groups["title"].Value, m.Groups["url"].Value);
}
//Encoding fileEncoding = Encoding.GetEncoding("d:\\11.html", Encoding.GetEncoding("GB2312"));



}
副上代码 希望帮忙解决, 我自己也找找!累哟!

2007-04-18 12:48
快速回复:汉字编码问题!
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.049736 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved