| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 1236 人关注过本帖, 1 人收藏
标题:请教各位一个截取字符的问题
取消只看楼主 加入收藏
nocooldown
Rank: 1
等 级:新手上路
帖 子:7
专家分:0
注 册:2014-3-7
结帖率:0
收藏(1)
已结贴  问题点数:20 回复次数:6 
请教各位一个截取字符的问题
小弟菜鸟一枚,请各位高人不吝赐教,非常感谢!!

现有一数据库,只有一字段,格式大致如下:

Democratic Progressive Party 民进党
problems facing agriculture, rural areas and farmers 农业、农村和农民问题
six categories of small projects for rural areas (water-efficient irrigation, potable water supplies, roads, methane production facilities, hydroelectric plants and pasture enclosure)农村"六小工程"
relief subsidies扶贫基金

现在想把中文和英文分别截取开来放到另外两个字段里。
我的思路是做循环,逐个判断是否非全角(ASC<128),直到有汉字停止,根据返回的值来截取。但是如果前面的英语中有类似第三行这样的符号或者>128的全角符号就会造成提前停止循环,返回的值不正确(偏小)。请问如何避免?另外我觉得我这个办法好笨,是否有更好的办法或强力的函数可用?
搜索更多相关主题的帖子: facilities supplies problems farmers plants 
2014-03-07 17:39
nocooldown
Rank: 1
等 级:新手上路
帖 子:7
专家分:0
注 册:2014-3-7
收藏
得分:0 
以下是引用wp231957在2014-3-7 17:50:37的发言:

测试一下全角字符的值  给他踢出去

就是说,还是建议用逐个字符判断的办法吗?
2014-03-07 17:53
nocooldown
Rank: 1
等 级:新手上路
帖 子:7
专家分:0
注 册:2014-3-7
收藏
得分:0 
以下是引用wp231957在2014-3-7 17:58:56的发言:

要不然就从后往前扫描  扫到笫一个AscII字符分界

呃,不行呢,比如第三行那样,中文里也夹有ASCII字符的,很可恶。。。
2014-03-07 18:01
nocooldown
Rank: 1
等 级:新手上路
帖 子:7
专家分:0
注 册:2014-3-7
收藏
得分:0 
非常感谢!各位版主和qjbzjp大大!!
是这样的,因小弟打算整理一些翻译的记忆库和术语库,从朋友公司扒了一些,网上也找了一些,所以格式五花八门。我原来用的翻译软件是TRADOS,导入功能相当不友好。国产的雪人在翻译库导入方面则相当强大,不管你什么格式什么顺序都能处理。但是雪人正版需要1600大洋,我打算自己先试试如果用VFP能实现就省点钱了。
确实如TonyDeng版主所说,原始数据格式就不该全半角混合,但这种情况在实际情况下都会碰到的。qjbzjp大大的办法我仔细想过是能解决目前这种情况,以后碰到新的问题也可以扩展,我继续向这个方向试试,再不行就肉痛点买个正版雪人算了。
2014-03-07 21:36
nocooldown
Rank: 1
等 级:新手上路
帖 子:7
专家分:0
注 册:2014-3-7
收藏
得分:0 
以下是引用sdta在2014-3-7 18:33:17的发言:

农村"六小工程":这个双引号也不要吗
(water-efficient irrigation, potable water supplies, roads, methane production facilities, hydroelectric plants and pasture enclosure):-()这些都不要吗
都要的,这个术语库当时估计输入的MM就是这样一下全角一下半角的。。。
2014-03-07 21:38
nocooldown
Rank: 1
等 级:新手上路
帖 子:7
专家分:0
注 册:2014-3-7
收藏
得分:0 
以下是引用sdta在2014-3-7 19:18:17的发言:

可能是译文
是的,是翻译用的术语库
2014-03-07 21:40
nocooldown
Rank: 1
等 级:新手上路
帖 子:7
专家分:0
注 册:2014-3-7
收藏
得分:0 
以下是引用TonyDeng在2014-3-8 10:00:30的发言:

翻譯的解釋文本中很多時候會包含西文字符(尤其是引用、參考單詞)的,至於在括號中注解更是常見,這種符號與前文的原文無法分辨,根本不能有效區分開來。哪有這麽簡單。

是的,主要是这类问题。而且我发现实际情况会更复杂,可以说没有通用的方法,只有碰到一种新情况再重新改程序。难怪雪人软件卖这么贵,还是有道理的。
2014-03-08 10:15
快速回复:请教各位一个截取字符的问题
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.020287 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved