- 浏览: 208378 次
- 性别:
- 来自: 广州
最新评论
-
谁说我不是会员:
不错,学习了。
查看java对象的内存占用情况 -
郭小小小:
solr之functionQuery(函数查询) -
LinApex:
这篇文章你忘记写了
使用redis实现自动补全 -
13534608437:
进价排名,每次往elevate.xml里面添加一条新的数据,是 ...
solr中竞价排名实现 -
飞天奔月:
不错的文章, 丝丝入扣 有条理
使用Log4j的邮件功能
文章列表
Schema Design Considerations
indexed fields
indexed fields 的数量将会影响以下的一些性能:
索引时的时候的内存使用量
索引段的合并时间
优化时间
索引的大小
我们可以通过 ...
- 2009-03-25 18:51
- 浏览 11190
- 评论(0)
函数查询 让我们可以利用 numeric域的值 或者 与域相关的的某个特定的值的函数,来对文档进行评分。
怎样使用函数查询
这里主要有两种方法可以使用函数查询,这两种方法都是通过solr http 接口的。
内嵌在正常的solr查询表达式中。即,将函数查询写在 q这个参数中,这时候,我们使用_val_将函数与其他的查询加以区别。至于具体怎样使用,请读者留意下面的例子。
使用明确为函数查询的参数,比如说dismax中的bf(boost function)这个参数。 注意:bf这个参数是可以接受多个函数查询的,它们之间用空格隔开,它们还可以带 ...
package weka.clusterers;
import weka.core.Capabilities;
import weka.core.Instance;
import weka.core.Instances;
/**
* Interface for clusterers. Clients will typically extend either
* AbstractClusterer or AbstractDensityBasedClusterer.
*
* @author Mark Hall (mhall@cs.waikato.ac.nz)
* @revision $ ...
- 2009-02-02 14:46
- 浏览 2088
- 评论(0)
怎样合并solr索引?
有些时候,我们有两个以上的索引,然后我们需要合并它们。这里有一个简单易用的方法,使用Lucene-misc 中的 IndeMergeTool。
首先,确定你使用的lucene的版本。你可以从solr.war包中查到你lucene的版本。
下载该版本的lucene
需要合并的索引 必须被关闭。
然后,你可以使用下面的命令:java -cp /path/to/lucene-core-VERSION.jar:/path/to/lucene-misc-VERSION.jar org/apache/lucene/misc/In ...
What is Distributed Search?
当一个索引越来越大,达到一个单一的系统无法满足磁盘需求的时候,或者一次简单的查询实在要耗费很多的时间的时候,我们就可以使用solr的分布式索引了。在分布式索引中,原来的大索引,将会分成多个小索引(索引并不定规模小,之前称之为小索引相对于之前的整个索引来讲的),solr可以将从这些小索引返回的结果合并,然后返回给客户端。
如果当前的solr查询请求能够很快被处理,而你只是希望整个搜索系统的处理能力,那么你可以看看这篇文章http://wiki.apache.org/solr/Col ...
CommonsHttpSolrServer
CommonsHttpSolrServer 使用HTTPClient 和solr服务器进行通信。
String url = "http://localhost:8983/solr";
SolrServer server = new CommonsHttpSolrServer( url );
CommonsHttpSolrServer 是线程安全的,建议重复使用CommonsHttpSolrServer 实例。
Setting XMLResponseParser
sorlr J 目 ...
我们知道,在Java中设置变量值的操作,除了long和double类型的变量外都是原子操作,也就是说,对于变量值的简单读写操作没有必要进行同步。
这在JVM 1.2之前,Java的内存模型实现总是从主存读取变量,是不需要进行特别的注意 ...
- 2009-01-08 15:57
- 浏览 963
- 评论(0)
/**
* Licensed to the Apache Software Foundation (ASF) under one or more
* contributor license agreements. See the NOTICE file distributed with
* this work for additional information regarding copyright ownership.
* The ASF licenses this file to You under the Apache License, Version 2.0
* (the ...
- 2009-01-07 16:35
- 浏览 1276
- 评论(0)
通常,lucene只返回与用户查询相关的文档,搜索的结果,跟lucene对文档评分有关。而在现实的查询中,我们有些时候需要为某些特定的文档指定它们在搜索结果中的位置。solr1.3 新推的组件QueryElevationComponent实现了这样的功能。
如何在solrconfig.xml中配置
下面是一个在solrconfig.xml中配置的范例:
<searchComponent name="elevator" class="org.apache.solr.handler.componen ...
Log4j的邮件功能能够为我们做这样的事情----当程序运行完的时候,或者正在运行也是可以的,它将程序的日志通过邮件的方式发到你的邮箱上。
这样,对于程序运行的控制就不用每次都跑到机器上去看日志文件这么麻烦了,我们需要的只是,开开Foxmail,用用鼠标,就可以知道,程序到底运行的怎么样了。
使用log4j-1.2.15
之前用的是 log4j-1.2.8 ,照理说,它们之间的版本号的区别够小,应该没有什么区别,但是事实却让我丈二摸不着头脑。
发送邮件的一个重要的类是SMTPAppender。
...
使用 closure 实现接口
interface X
{ void f(); void g(int n); void h(String s, int n); }
x = {Object[] args -> println "method called with $args"} as X
x.f()
x.g(1)
x.h("hello",2)
上面的例子使用 closure实现了接口
method called with null
method called with {1}
method called with {&quo ...
- 2008-12-15 11:13
- 浏览 1684
- 评论(0)
Steps
Download the latest Grails release
Extract the archive into an appropriate location; typically C:\grails on Windows or ~/grails on Unix
Create a GRAILS_HOME environment variable that points to the path where you extracted the archive (eg C:\grails on Windows or ~/grails on Unix)
If you have ...
- 2008-12-11 14:55
- 浏览 1218
- 评论(0)
配置HDFS
配置HDFS应该是一件不难的事情。首先,我们先配好HDFS的配置文件,再对NameNode进行format操作。
配置Cluster
这里,我们假定,你已经下载了Hadoop的一个版本,并解压完毕。
Hadoop ...
简介
HDFS, the Hadoop Distributed File System, 是一个分布式系统,它被设计用来存储大数据量的信息(通常是TB或PB),并提供对数据进行高吞吐量访问的性能。文件被存储在多台机器中,确保系统的抗失效性能以及并行应用程序的高效。这篇文章主要介绍 HDFS的设计意图、结构,并告诉读者怎样去使用它。
本文的目标:
了解HDFS的设计意图,以及基本的分布式系统的一些概念。
学习怎样从命令行中设置和使用HDFS。
学习怎样在应用程序中使用HDFS。
分 ...
本文主要讨论solr中的dataImportHandler机制,对这个不熟的朋友,可以先看下。solr wiki中的dataimporthandler这篇文章,笔者也对dataimporthandler进行了一些翻译,不过效果不是很好,有兴趣的朋友也可以参考一下。 http://mxsfengg.blog.163.com/blog/static/26370218200810250524813/。
想对比较多的数据建立索引,当然要考虑一个量的问题。之前怀疑sqlEntityProcessor是一条条的去数据库中取数据的,因为还有个CachedSql ...