`
poson
  • 浏览: 348035 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论
文章列表
  垂直搜索与web搜索有很大的不同,一个非常大的区别在于对数据的获取。google、百度的数据来自互联网。通过spider工具爬取得来。获取的网页通过去重,去除垃圾网站,最后通过适当的排序排序算法呈现在用户面前。而垂直搜索的数据多数需要大量手工或者半自动化的处理,搜索的准确性、质量得到很多的提高。但是分析那些数据已经更新,如何得到新的数据,面临很多的困难。可以简单的认为,web搜索引擎的数据来自一个开发的互联网系统,数据由web用户提供、更新。而垂直搜索引擎的数据是一个相对封闭的系统,需要相关公司不断的整理和更新。数据越多、维护起来也就越麻烦。各个同类的垂直搜索不仅仅要比拼搜索的算法,还要比 ...
//使用布尔查询 BooleanQuery bquery = new BooleanQuery();foreach (string str in listEn){query1 = new TermQuery(new Term("en", str));//BooleanClause.Occur.SHOULD表示关键词或bquery.Add(query1, BooleanClause.Occur.SHOULD);} //*这里设置关键词必须至少出现多少个bquery.SetMinimumNumberShouldMatch(count);Hits hits = Paramete ...
  1、打开: MapInfo.Data.Table table = MapInfo.Engine.Session.Current.Catalog.OpenTable(open.FileName);this.mapControl1.Map.Load(new MapTableLoader(table)); 2、选择点mapControl1.Map.GetDisplayCoordSys(); MapInfo.Geometry.DPoint dp = new MapInfo.Geometry.DPoint();MapInfo.Geometry.DPoint dpout = new MapInf ...
  (1)下载一个libsvm的.net 的包(2)然后把自己的数据整理成libsvm的输入格式。(3)使用训练数据得到训练结果(4)使用训练结果+测试数据,得到测试结果。(5)怎么调节libsvm的参数就不知道了。需要根据应用的要求,数据的特点来修改参数(6)验证测试的结果。观察分类是否正确 libsvm,A Library for Support Vector Machineshttp://www.csie.ntu.edu.tw/~cjlin/libsvm/
  excel 几个函数:search,find,len 问题:对单词词库按照字符长度排序。然后去除含有“-”的单词。 方法:使用len得到字符串的长度。如len(A1),然后ctrl+c,选择一列,ctrl+D,复制公式到一整列。按照字符串长度排序search函数查询字符串中是否有字符“-”。公式:if(search("-",A1,0)>=0,true,false)
  短信搜索的内容包括几类:衣食住行的本地信息、购买指南、娱乐八卦、彩票、心理测试、星座运程等、股票基金、健康常识、手机号码查询,公交航班信息 铃声,图片等。在短信搜索这些门类中,那些是用户必不可少的呢?我们发现很多都是有替代的产品,或者有非常多的竞争对手。(1)114,号码百事通。提供语音服务,信息也非常丰富。本来不是短信搜索,但由于对短信搜索的竞争压力很大,因此列在这里。114的短信搜索号码919114。(2)明复,提供种类非常多的服务。数据比较丰富,效果比较好的一个服务。(3)google短信搜索,999333谷歌短信搜索,用户可以查询实时股票信息、获取天气预报、查询火车时刻以及多语言 ...
  用户输入的关键词常常有拼写错误。当单词错误错误的时候,查询结果受到很大的影响。这个时候拼写检查和纠正就非常有用。如google的拼写检查,他不会主动把拼写检查之后的结果给用户。它采取的办法是:给出一个纠正后的单词用于提示。常见的错误如下:(1)barbarossa(2)bussiness 其中business拼写错误(3)Betavus,应该是查询Batavus 拼写检查器的算法可以参考:http://blog.youxu.info/spell-correct.html。主要是一个单词添加、删除一些词语后看这些词语是否正确。
  c#中一个非常方便的工具。以前用vc++6.0实现监视文件变化,要么需要函数钩子,要么需要写驱动程序。System.IO.FileSystemWatcher watcher = new System.IO.FileSystemWatcher(path, baseName);FileSystemEventHandler handler = new FileSystemEventHandler(FileOnChanged);watcher.Changed += handler;watcher.Created += handler;watcher.Deleted += handler;watch ...
  本文仅记录一些简单的使用方法,供初学者参考。以下例子采用 Lucene.NET 1.9 版本,可取去 Lucene.Net 下载。1. 基本应用   using System;using System.Collections.Generic;using System.Text;using Lucene.Net;using Lucene.Net.Analysis;using Lucene.Net.Analysis.Standard;using Lucene.Net.Documents;using Lucene.Net.Index;using Lucene.Net.QueryParse ...
 Lucene 的搜索 以上完成了索引的建立和一些关于索引的知识,但是光有索引是不行的,我们真正要做的检索,这才是我们的关键。现在我们看看 lucene 的检索吧。 认识检索从检索的工具开始吧! IndexSearcher 类是 lucene 用于检索的工具类,我们在检索之前要得到这个类的实例。 第一步我们看以下代码: IndexSearcher searcher = new IndexSearcher("c:\\index"); 创建 IndexSearcher 实例需要告诉 lucene 索引的位置,就是你 IndexWrite 的文件路径。 ...
  1 Native的数据表现形式包括sms,wap、web site等等形式。目前native还只有北京的数据。   Native 收费情况 免费 网页上是否可以看见数据的地址 可以
需要先使用set define off。关闭识别变量的开关才能正常更新。toad中使用sql plus,执行速度要快一些。toad不会没有响应。
查找问号只需要使用“~? ”只要在前面加一个~就行了
     //big5繁体转换简体的程序public class Big5toGB2312{[DllImport("kernel32.dll", EntryPoint = "LCMapStringA")]public static extern int LCMapString(int Locale, int dwMapFlags, byte[] lpSrcStr, int cchSrc, byte[] lpDestStr, int cchDest); const int LCMAP_SIMPLIFIED_CHINESE = 0x02000000;con ...
  同一时刻只能有一个对索引的写操作,在写的同时可以进行搜索。 但是实践发现,对索引写了之后,并不能马上查询到结果。如果重新 IndexSearcher indexSearcher = new Lucene.Net.Search.IndexSearcher(Parameter.indexPath)。 这样就可以马上看到更新的结果。 不利在于:这样重新new一个indexsearcher对象对性能有一定的影响。但是对实时要求不是太高的应用影响也不是很大。
Global site tag (gtag.js) - Google Analytics