查看详情
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

chocket的博客

博客是我的业务

 
 
 
 
 
 

分布式全文检索系统的一个简单构想

2012-6-18 10:37:41 阅读106 评论0 182012/06 June18

作者  | 2012-6-18 10:37:41 | 阅读(106) |评论(0) | 阅读全文>>

lucene中的ranking算法

2008-11-27 14:06:49 阅读243 评论6 272008/11 Nov27

说明见Similarity.java的javadoc信息:


算法请参考javadoc的,它使用的是Vector Space Model (VSM) of Information Retrieval

                针对一条查询语句q(query),一个d(document)的得分公式
score(q,d)   =   coord(q,d)  ·  queryNorm(q)

作者  | 2008-11-27 14:06:49 | 阅读(243) |评论(6) | 阅读全文>>

相关度计算与信噪比

2008-11-21 12:27:17 阅读246 评论2 212008/11 Nov21

你知道google和百度两个关键词的相关度是多少么?

--最后我将来回答这个问题

通常我们对于文本信息之间得相关性得计算都是采用向量的办法,我在以前的PPT里曾经提到过。然而对于文本信息更深层次的分析不能单纯从字面上分析一篇文章的关键词,更重要的是它隐含的扩展的意义。

传统的关于计算文本相关度和【网页和查询的相关性】的计算都是采用匹配的方式进行的,然而这只能是基于字面意义上的统计计算。这里介绍的做法是采用关键词相关性扩展的做法从而得到更加精确的相关度计算。

作者  | 2008-11-21 12:27:17 | 阅读(246) |评论(2) | 阅读全文>>

Java反射机制

2008-11-13 9:34:26 阅读173 评论0 132008/11 Nov13

package reflect;

import java.lang.reflect.Field;
import java.lang.reflect.Method;

public class ReflectTester {

@SuppressWarnings("unchecked")
public Object copy(Object object) throws Exception {
//获得对象类型
Class classType = object.getClass();

作者  | 2008-11-13 9:34:26 | 阅读(173) |评论(0) | 阅读全文>>

JAVA读取xml文件

2008-11-12 18:58:24 阅读163 评论2 122008/11 Nov12

package com;

import org.w3c.dom.*;
import javax.xml.parsers.*;
import java.io.*;

public class Parse{
 //Document可以看作是XML在内存中的一个镜像,那么一旦获取这个Document 就意味着可以通过对
 //内存的操作来实现对XML的操作,首先第一步获取XML相关的Document
  private Document doc=null;
 
 public void init(String xmlFile) throws Exception{
  //很明显该类是一个单例,先获取产生DocumentBuilder工厂

作者  | 2008-11-12 18:58:24 | 阅读(163) |评论(2) | 阅读全文>>

查看所有日志>>

 
 
 
 
 
 
 
 

浙江省 杭州市 水瓶座

 发消息  写留言

 
博客等级加载中...
今日访问加载中...
总访问量加载中...
最后登录加载中...
 
 
 
 
 
 
 
心情随笔列表加载中...
 
 
 
 
 
 
 
博友列表加载中...
 
 
 
 
 

发现好博客

 
 
列表加载中...
 
 
 
 
 
 
 
列表加载中...
 
 
 
 
 
 我要留言
 
 
 
留言列表加载中...
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018

注册 登录  
 加关注