2007-07-23

Lucene+Heritrix开发自己的搜索引擎

关键字: Lucene,Heritrix,搜索引擎,爬虫
Lucene 是apache软件基金会jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。 作为一个开放源代码项目,Lucene从问世之后,引发了开放源代码社群的巨大反响,程序员们不仅使用它构建具体的全文检索应用,而且将之集成到各种系统软件中去,以及构建Web应用,甚至某些商业软件 ...
2007-05-30

Appfuse的不惑

关键字: Appfuse
开始接触Appfuse了,眼前的项目就要开工了,忍不住自己写这些东西,有感于最近两周来看过所有关于Appfuse的先驱们!公司这边要求用Appfuse的时候,在JAVAEYE看到了robbin关于Appfuse--“玩具论”的文字,从起初的感叹到现在开始务实的进入Appfuse体系,采集下各位先驱的名言,每个人都有自己不同的看法,在面对Appfuse是好是坏的时候,我还是感谢Appfuse给自己带来了一个新的思想境界,而不是仅仅看它开发速度有多快,多灵活,集成的框架有多少。在J道里有人提出将组建思想发扬广大,做为一个出入行业一年的我来说,有太多的东西要用大脑认真思考,总 ...
2007-05-14

DOM4j使用教程

关键字: XML操作,DOM4j
DOM4j是一个易用的,开源的JAVA操作XML的API,写过一篇4种XML操作API的比较,DOM4j是性能和易用行最佳的。因此做一个小教程,供初学者学习。          学习DOM4j首先就先来了解下它主要的包                 DOM4j所有的接口都在org.dom4j这个包里定义着     &nb ...
O.Lions
搜索本博客
存档
最新评论
评论排行榜