Spring框架中调用HanLP分词的方法

  • 时间:
  • 浏览:1
  • 来源:uu快3教程_uu快3代理_手机版

整好了以前把data文件夹和hanlp.properties放入去项目的资源文件夹里,在配置文件里修改一下路径和IOAdapte:

我不在 乎 正确的外理方案应该是啥,感觉这种法律办法还是很鸡贼的。

改了HanLP的词典就导致 分析可不都还都还可以 用maven直接导入仓库里的包了,可不都还都还可以 都还都还可以 直接将修改后的data文件放入去本地,假如指定路径给HanLP。搜了一下网上什么都法律办法,都是在项目部署的以前,把HanLP的词典数据放入去服务器上有有一个 固定位置上,假如再配置HanLP的配置文件,指定有有一个 固定位置。这种法律办法着实 直接,假如可不都还都还可以 把HanLP的词典数据跟整个项目打包到一起,管理起来很麻烦。假如把数据直接作为项目的资源文件,部署到Tomcat上后无论为社 在配置里写路径都是提示找可不都还都还可以 词典文件。研究了一下HanLP的issue以前,我发现这种项目支持自定义读写文件的IO类。在有有一个 将词典数据放入去HDFS上的有有一个 blog启发下,让我 了有有一个 很鸡贼的法律办法,我重写有有一个 IOAdapter类,使用读写静态资源文件的法律办法读取词典数据了,假如不就都可不都还都还可以 都还都还可以 把data跟项目打包到一起了嘛。

事情是假如的,最近实验室在搞有有一个 Java Web的项目,用的Spring MVC的框架。项目组有什么都没做过Spring的学弟学妹,为了提高传输时延,我让大伙儿自己先抛开Spring来写自己负责的模块,我来把各个模块在Spring里集成。

项目里有有有一个 文本分析的模块是有有一个 学妹负责的,后面 用到了HanLP,我在集成的以前直接用maven加带的依赖,等集成好了测试的以前发现为社 也测不过,问了学妹才发现为了做实体识别,她用了有有一个 很有意思的法律办法,自己改了HanLP的词典,手动加了好多词,假如后期版本迭代中还有可能性继续改。。。。

文章来源于狼血wolfblood的博客

代码如下: