discuz的在线中文分词服务
2009/06/19 20:52 ArthurXF
本人ArthurXF倾情奉献此文章,转载请注明出处,谢谢。
中文分词越来越收到重视,可是如何去收集一个庞大的词库呢?又如何能够通过词库做好合理的中文分词呢?这些问题困扰着我们很长时间了。现在我来提供一个简单的分词方法,不需要提供词库就可以进行分词。还可以转编码呢?呵呵
http://keyword.discuz.com/related_kw.html?title=你的标题&content=你的内容&ics=输入时的编码&ocs=输出时的编码。
例子:
http://keyword.discuz.com/related_kw.html?title=BIWEB开源建站系统
就会返回一个XML,默认编码为GB2312.里面会拆分为 BIWEB、系统、开源三个词
这样只需要解析这个XML,就可以拿到拆分后的分词了,是不是很简单啊?呵呵。
BIWEB WMS开源建站系统,欢迎大家下载使用。http://www.biweb.cn
中文分词越来越收到重视,可是如何去收集一个庞大的词库呢?又如何能够通过词库做好合理的中文分词呢?这些问题困扰着我们很长时间了。现在我来提供一个简单的分词方法,不需要提供词库就可以进行分词。还可以转编码呢?呵呵
http://keyword.discuz.com/related_kw.html?title=你的标题&content=你的内容&ics=输入时的编码&ocs=输出时的编码。
例子:
http://keyword.discuz.com/related_kw.html?title=BIWEB开源建站系统
就会返回一个XML,默认编码为GB2312.里面会拆分为 BIWEB、系统、开源三个词
这样只需要解析这个XML,就可以拿到拆分后的分词了,是不是很简单啊?呵呵。
BIWEB WMS开源建站系统,欢迎大家下载使用。http://www.biweb.cn