一团乱麻,批量分析提取,求指点迷津
苦逼的数据工作,在里面沉陷,试着做了一个小小的雏形工具:
1、导入杂乱信息的文档
2、把线头理出来
3、批量提取:
企业机关事业单位
地址
联系方式
。。。。。。
以后我们还可以延伸到提取标准,规范的名称,编号等。
但是,做着做着,就不知道怎么往下走了,
各位都是圈子的高手,所以希望能高手提点一下:
1.我们这类识别器还可以朝哪些方向发展
2.哪些地方可以用的到
3.如果我们想朝大数据靠拢,还应该增加哪些功能?
我们自己公司本身不是专业做这方面的 ,
大家都是圈子的里的人 ,所以希望各大高人能给与一些提点