| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 985 人关注过本帖
标题:汉字编码问题!
只看楼主 加入收藏
xiaobaisj
Rank: 1
等 级:新手上路
帖 子:74
专家分:0
注 册:2007-3-11
收藏
得分:0 
咳,郁闷这汉字搞的我头痛!继续顶,我再找找, 谢谢斑竹!
2007-04-18 10:50
bygg
Rank: 16Rank: 16Rank: 16Rank: 16
来 自:乖乖的心中
等 级:版主
威 望:241
帖 子:13555
专家分:3076
注 册:2006-10-23
收藏
得分:0 
用 getBytes 这个试试.

飘过~~
2007-04-18 10:55
xiaobaisj
Rank: 1
等 级:新手上路
帖 子:74
专家分:0
注 册:2007-3-11
收藏
得分:0 
对了,要是是unicode的编码方式的话,我要怎么实现汉字转换??
2007-04-18 11:25
Kendy123456
Rank: 10Rank: 10Rank: 10
等 级:贵宾
威 望:62
帖 子:2720
专家分:0
注 册:2007-1-3
收藏
得分:0 
StreamReader sr = New StreamReader ("d:\\11.html", System.Text.Encoding.GetEncoding("gb2312"))

2007-04-18 12:28
xiaobaisj
Rank: 1
等 级:新手上路
帖 子:74
专家分:0
注 册:2007-3-11
收藏
得分:0 
是这样的,我现在有个 html格式的文件,里面有很多超连接,我现在要做的事把这些超连接提取出来,当然还包括这些连接的名字也就是title,但是我提取的时候呢,就遇到汉字转换不过来的问题,楼上的,你说的方法我也试过还是不行,
谢谢
2007-04-18 12:46
xiaobaisj
Rank: 1
等 级:新手上路
帖 子:74
专家分:0
注 册:2007-3-11
收藏
得分:0 

public static void TestToDe()
{
StreamReader sr = new StreamReader("d:\\11.html", Encoding.GetEncoding("gb2312"));

string strHtml = sr.ReadToEnd();

string p = @"<a\s+[^>]*href\s*=\s*(?:""(?<url>[^""]*)""|'(?<url>[^']*)'|(?<url>[^>^\s]+))[^/]*>(?<title>[^<>]*)<[/]?";
//@"\<a.*href\s*=\s*(?:""(?<url>[^""]*)""|'(?<url>[^']*)'|(?<url>[^\>^\s]+)).*\>(?<title>[^\<^\>]*)\<[^\</a\>]*/a\>";
// getBytes


Regex reg = new Regex(p, RegexOptions.IgnoreCase | RegexOptions.Compiled);
MatchCollection ms = reg.Matches(strHtml);

foreach (Match m in ms)
{
Console.WriteLine("{0}\n{1}\n\n", m.Groups["title"].Value, m.Groups["url"].Value);
}
//Encoding fileEncoding = Encoding.GetEncoding("d:\\11.html", Encoding.GetEncoding("GB2312"));



}
副上代码 希望帮忙解决, 我自己也找找!累哟!

2007-04-18 12:48
xiaobaisj
Rank: 1
等 级:新手上路
帖 子:74
专家分:0
注 册:2007-3-11
收藏
得分:0 
救命,老师在催,我还没解决!:(
2007-04-18 13:13
xiaobaisj
Rank: 1
等 级:新手上路
帖 子:74
专家分:0
注 册:2007-3-11
收藏
得分:0 

现在问题有点明朗了,就是如何把Unicode转化成gb2312
但是我只知道转个字符串,要是我现在是读取html文件,还有点问题
附上代码!
StreamReader sr = new StreamReader("d:\\11.html", Encoding.GetEncoding("gb2312"));

string strHtml = sr.ReadToEnd();
string a = System.Text.Encoding.GetEncoding("GB2312").GetString(System.Text.Encoding.UTF8.GetBytes(strHtml));

2007-04-18 14:31
快速回复:汉字编码问题!
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.044901 second(s), 7 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved