`
fuyangchang
  • 浏览: 146068 次
  • 性别: Icon_minigender_1
  • 来自: 大连
社区版块
存档分类
最新评论
文章列表
    作者:江南白衣    Nutch是一个基于Lucene,类似Google的完整网络搜索引擎解决方案,基于Hadoop的分布式处理模型保证了系统的性能,类似Eclipse的插件机制保证了系统的可客户化,而且很容易集成到自己的应用之中。    Nutch 0.8 完全使用Hadoop重写了骨干代码,另有很多地方作了合理化修正,非常值得升级。1.Nutch 0.8 的安装与运行nutch 0.7.2的中文安装文档满街都是,nutch 0.8的安装文档见Tutorial (0.8) , 要注意两点: 一是 crawl命令里的urls参数从指定文件变为了指定目录, 即原来的urls 要改存到url ...
Compass学习文档(1)作者:javafishCompass是第一个实现java搜索引擎的开源框架,它是基于 Lucene之上的,提供更简单的搜索引擎API,事务支持,对象到搜索引擎映射(Annotations & XML),Xml到搜索引擎映射,可以和Hibernate,Spring集成,功能非常的强大。如果用Hibernate,Spring做的项目需要搜 索引擎的话,Compass是个非常好的选择。个人认为:如果说Lucene是搜索引擎中的JDBC,那么Compass就是Hibernate。而 Compass和Hibernate不仅仅是比喻的像,它们的类和用法,和作用也非常的像。 ...
 原始的Ajax:直接使用XmlHttpRequest  如上所述,Ajax的核心是JavaScript对象XmlHttpRequest。下面的示例文章评价系统将带您熟悉Ajax的底层基本知识:http://tearesolutions.com/ajax-demo/raw-ajax.html。注:如果您已经在本地WebLogic容器中安装了ajax-demo.war,可以导航到http://localhost:7001/ajax-demo/raw-ajax.html,  浏览应用程序,参与投票,并亲眼看它如何运转。熟悉了该应用程序之后,继续阅读,进一步了解其工作原理细节。首先,您拥有一些简单的定 ...
<%...@ page contentType="text/html; charset=GBK" %><%...@ page import
tomcat连接池的配置与使用数据库mysql                                        关于tomcat连接池的配置,我在自己开始的时候碰到过许多的问题,至少失败过六次,今天终于成功了。对于这个问题的产生与由来我也给大伙说说。 在《程序员csdn开发高手》这本杂志的2004年第02期,一位名叫宋廷宇的老师写了一篇文章,名赤《tomcat连接池的图形化配置与使用》,我看到 了这篇文章,该作者所使用的数据库是sql server,而我所使用的数据库是mysql,tomcat版本为5.0 19。文中有这么一段话:“在tomcat 4.1.18及后续版本中提供了图形 ...
JAVA读取WORD,EXCEL,POWERPOINT,PDF文件的方法http://blog.sina.com.cn/u/54c1567b010008vhOFFICE文档使用POI控件,PDF可以使用PDFBOX0.7.3控件,完全支持中文,用XPDF也行,不过感觉PDFBOX比较好,而且作者也在更新。水平有限,万望各位指正 WORD:import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.apache.poi.hwpf.extractor.WordExtract ...
 利用html:error和html:message标签实现信息提示需要做三方面的处理:1.jsp页面中的代码片断:<table width="100%" align="left" border=0>      <tr align="left">      <td colspan="2" nowrap><span class="ErrorStyle"><html:errors/></
 bean:writehttp://www.solol.org/technologic/java/j-struts/#d10e504bean:write标签将指定的bean的属性值写到当前的JspWriter中,并且可以对输出进行格式化。下面的代码片段示例了bean:write标签输出User-Agent:<logic:present header="User-Agent"> <bean:header id="header" name="User-Agent"/> <bean:write name=&q ...
 某些网站允许软件开发社团通过发布开发者指南、白皮书、FAQs【常见问题解答】和源代码以实现信息的共享。随着信息量的增长,和几个开发者贡献出自己的 知识库,于是网站提供搜索引擎来搜索站点上现有的所有信息。虽然这些搜索引擎对文本文件的搜索可以做的很好,但对开发者搜索源代码做了比较严格的限制。搜 索引擎认为源代码就是纯文本文件,因此,在这一点上,与成熟的可以处理大量源文件的工具――grep相比没有什么不同。在这篇文章中,我推荐使用Lucene,它是基于Java的开源搜索引擎,通过提取和索引相关的源码元素来搜索源代码。这里,我仅限定搜索Java源代码。然而,Lucene同样可以做到对其他编程语言的源代 ...
js 代码   /**//**   *本日历选择控件由tiannet根据前人经验完善而得。大部分代码来自meizz的日历控件。   *tiannet添加了时间选择功能、select,object标签隐藏功能,还有其它小功能。   *使用方法:   * (1)只选择日期   <input type="text" name="date"   readOnly onClick="setDay(this);">   * (2)选择日期和小时  <input type=&quo ...
Calendar.js(注:在.net环境下.js文件需存为utf-8格式)/**//**//**//** *本日历选择控件由tiannet根据前人经验完善而得。大部分代码来自meizz的日历控件。 *tiannet添加了时间选择功能、select,object标签隐藏功能,还有其它小功能。 *使用 ...
 http://book.csdn.net/bookfiles/276/index.html#c1csdn中的 Lucene IN ACTION 中文版网址,可以看到前四章
java 代码   public static HashMap getRowSet(ResultSet rs)throws Exception   {          if(rs.next())          {            ResultSetMetaData rsm = rs.getMetaData();            //ResultSetMetaData 接口创建一个对象,可使用该对象找出 ResultSet 中的各列的类型和属性。            int size=rsm.getColumnCou ...
   1.  function getRadioGroupValue(RadioGroup)...{      2.    for(var i=0;i    3.       
js 代码   function getRadioGroupValue(RadioGroup){      for(var i=0;i       {if (RadioGroup[i].checked){return RadioGroup[i].value;}}         if (RadioGroup.checked){return RadioGroup.value;}      return "";   }   var myvalue = getRadioGroupValue(parsList);   当 ...
Global site tag (gtag.js) - Google Analytics