solr性能调优

博客分类：

solr

Schema Design Considerations indexed fields indexed fields 的数量将会影响以下的一些性能：索引时的时候的内存使用量索引段的合并时间优化时间索引的大小我们可以通过 � ...

2009-03-25 18:51
浏览 11190
评论(0)

函数查询让我们可以利用 numeric域的值或者与域相关的的某个特定的值的函数，来对文档进行评分。怎样使用函数查询这里主要有两种方法可以使用函数查询，这两种方法都是通过solr http 接口的。内嵌在正常的solr查询表达式中。即，将函数查询写在 q这个参数中，这时候，我们使用_val_将函数与其他的查询加以区别。至于具体怎样使用，请读者留意下面的例子。使用明确为函数查询的参数，比如说dismax中的bf（boost function）这个参数。注意：bf这个参数是可以接受多个函数查询的，它们之间用空格隔开，它们还可以带 ...

2009-03-20 13:57
浏览 22092
评论(1)
论坛回复 / 浏览 (0 / 11744)
分类:企业架构

weka 之聚类

package weka.clusterers; import weka.core.Capabilities; import weka.core.Instance; import weka.core.Instances; /** * Interface for clusterers. Clients will typically extend either * AbstractClusterer or AbstractDensityBasedClusterer. * * @author Mark Hall (mhall@cs.waikato.ac.nz) * @revision $ ...

2009-02-02 14:46
浏览 2088
评论(0)

合并solr索引

博客分类：

solr

Solr lucene Apache Java

怎样合并solr索引？有些时候，我们有两个以上的索引，然后我们需要合并它们。这里有一个简单易用的方法，使用Lucene-misc 中的 IndeMergeTool。首先，确定你使用的lucene的版本。你可以从solr.war包中查到你lucene的版本。下载该版本的lucene 需要合并的索引必须被关闭。然后，你可以使用下面的命令：java -cp /path/to/lucene-core-VERSION.jar:/path/to/lucene-misc-VERSION.jar org/apache/lucene/misc/In ...

2009-01-20 10:07
浏览 4049
评论(0)
论坛回复 / 浏览 (0 / 2456)
分类:企业架构

solr-wiki----solr分布式索引

博客分类：

solr

Solr XML Perl UP Servlet

What is Distributed Search? 当一个索引越来越大，达到一个单一的系统无法满足磁盘需求的时候，或者一次简单的查询实在要耗费很多的时间的时候，我们就可以使用solr的分布式索引了。在分布式索引中，原来的大索引，将会分成多个小索引（索引并不定规模小，之前称之为小索引相对于之前的整个索引来讲的），solr可以将从这些小索引返回的结果合并，然后返回给客户端。如果当前的solr查询请求能够很快被处理，而你只是希望整个搜索系统的处理能力，那么你可以看看这篇文章http://wiki.apache.org/solr/Col ...

2009-01-15 11:52
浏览 10187
评论(2)
论坛回复 / 浏览 (1 / 6165)
分类:企业架构

solr1.3新特性，solrj的使用

博客分类：

solr

Solr Tomcat json Bean 浏览器

CommonsHttpSolrServer CommonsHttpSolrServer 使用HTTPClient 和solr服务器进行通信。 String url = "http://localhost:8983/solr"; SolrServer server = new CommonsHttpSolrServer( url ); CommonsHttpSolrServer 是线程安全的，建议重复使用CommonsHttpSolrServer 实例。 Setting XMLResponseParser sorlr J 目 ...

2009-01-13 00:55
浏览 5055
评论(6)
论坛回复 / 浏览 (6 / 10956)
分类:企业架构

java中的volatile

博客分类：

java

Java 多线程 JVM

我们知道，在Java中设置变量值的操作，除了long和double类型的变量外都是原子操作，也就是说，对于变量值的简单读写操作没有必要进行同步。这在JVM 1.2之前，Java的内存模型实现总是从主存读取变量，是不需要进行特别的注意� ...

2009-01-08 15:57
浏览 963
评论(0)

第一次使用jetty

博客分类：

java

Solr Servlet Apache

/** * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with * this work for additional information regarding copyright ownership. * The ASF licenses this file to You under the Apache License, Version 2.0 * (the ...

2009-01-07 16:35
浏览 1276
评论(0)

solr中竞价排名实现

博客分类：

solr

Solr lucene XML Apache

通常，lucene只返回与用户查询相关的文档，搜索的结果，跟lucene对文档评分有关。而在现实的查询中，我们有些时候需要为某些特定的文档指定它们在搜索结果中的位置。solr1.3 新推的组件QueryElevationComponent实现了这样的功能。如何在solrconfig.xml中配置下面是一个在solrconfig.xml中配置的范例： <searchComponent name="elevator" class="org.apache.solr.handler.componen ...

2008-12-31 13:22
浏览 4798
评论(4)
论坛回复 / 浏览 (2 / 4023)
分类:企业架构

使用Log4j的邮件功能

博客分类：

Log4j

log4j Apache 配置管理 .net thread

Log4j的邮件功能能够为我们做这样的事情----当程序运行完的时候，或者正在运行也是可以的，它将程序的日志通过邮件的方式发到你的邮箱上。这样，对于程序运行的控制就不用每次都跑到机器上去看日志文件这么麻烦了，我们需要的只是，开开Foxmail，用用鼠标，就可以知道，程序到底运行的怎么样了。使用log4j-1.2.15 之前用的是 log4j-1.2.8 ，照理说，它们之间的版本号的区别够小，应该没有什么区别，但是事实却让我丈二摸不着头脑。发送邮件的一个重要的类是SMTPAppender。 ...

2008-12-18 17:55
浏览 2254
评论(4)
论坛回复 / 浏览 (3 / 3553)
分类:企业架构

怎样在groovy中实现接口

Groovy F#

使用 closure 实现接口 interface X { void f(); void g(int n); void h(String s, int n); } x = {Object[] args -> println "method called with $args"} as X x.f() x.g(1) x.h("hello",2) 上面的例子使用 closure实现了接口 method called with null method called with {1} method called with {&quo ...

2008-12-15 11:13
浏览 1684
评论(0)

Groovy的安装

Groovy Grails Windows Unix C

Steps Download the latest Grails release Extract the archive into an appropriate location; typically C:\grails on Windows or ~/grails on Unix Create a GRAILS_HOME environment variable that points to the path where you extracted the archive (eg C:\grails on Windows or ~/grails on Unix) If you have ...

2008-12-11 14:55
浏览 1218
评论(0)

Hadoop分布式系统（中）

博客分类：

hadoop

Hadoop 配置管理 Linux 数据结构脚本

配置HDFS 配置HDFS应该是一件不难的事情。首先，我们先配好HDFS的配置文件，再对NameNode进行format操作。配置Cluster 这里，我们假定，你已经下载了Hadoop的一个版本，并解压完毕。 Hadoop� ...

2008-12-02 13:45
浏览 2039
评论(0)
论坛回复 / 浏览 (0 / 7252)

hadoop分布式系统（上）

博客分类：

hadoop

Hadoop Linux 应用服务器 Mapreduce 数据结构

简介 HDFS, the Hadoop Distributed File System, 是一个分布式系统，它被设计用来存储大数据量的信息（通常是TB或PB），并提供对数据进行高吞吐量访问的性能。文件被存储在多台机器中，确保系统的抗失效性能以及并行应用程序的高效。这篇文章主要介绍 HDFS的设计意图、结构，并告诉读者怎样去使用它。本文的目标: 了解HDFS的设计意图，以及基本的分布式系统的一些概念。学习怎样从命令行中设置和使用HDFS。学习怎样在应用程序中使用HDFS。分 ...

2008-11-28 10:55
浏览 1359
评论(3)
论坛回复 / 浏览 (3 / 6762)

solr-dataimportHandler之批量索引

Solr 数据结构 XML Blog

本文主要讨论solr中的dataImportHandler机制，对这个不熟的朋友，可以先看下。solr wiki中的dataimporthandler这篇文章，笔者也对dataimporthandler进行了一些翻译，不过效果不是很好，有兴趣的朋友也可以参考一下。 http://mxsfengg.blog.163.com/blog/static/26370218200810250524813/。想对比较多的数据建立索引，当然要考虑一个量的问题。之前怀疑sqlEntityProcessor是一条条的去数据库中取数据的，因为还有个CachedSql ...

2008-11-25 15:54
浏览 3515
评论(0)
论坛回复 / 浏览 (0 / 2988)
分类:企业架构

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

solr性能调优

solr之functionQuery(函数查询)

weka 之聚类

合并solr索引

solr-wiki----solr分布式索引

solr1.3新特性，solrj的使用

java中的volatile

第一次使用jetty

solr中竞价排名实现

使用Log4j的邮件功能

怎样在groovy中实现接口

Groovy的安装

Hadoop分布式系统（中）

hadoop分布式系统（上）

solr-dataimportHandler之批量索引

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>