??xml version="1.0" encoding="utf-8" standalone="yes"?>欧美日韩精品一区二区,久久久久久久精,一本久久知道综合久久http://www.aygfsteel.com/xinyi309/在搜索的天空下振翱? zh-cnTue, 15 Jul 2025 09:39:43 GMTTue, 15 Jul 2025 09:39:43 GMT60Q{Q四条黄金忠?/title><link>http://www.aygfsteel.com/xinyi309/archive/2006/03/19/36021.html</link><dc:creator>Search Engine </dc:creator><author>Search Engine </author><pubDate>Sun, 19 Mar 2006 02:56:00 GMT</pubDate><guid>http://www.aygfsteel.com/xinyi309/archive/2006/03/19/36021.html</guid><wfw:comment>http://www.aygfsteel.com/xinyi309/comments/36021.html</wfw:comment><comments>http://www.aygfsteel.com/xinyi309/archive/2006/03/19/36021.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.aygfsteel.com/xinyi309/comments/commentRss/36021.html</wfw:commentRss><trackback:ping>http://www.aygfsteel.com/xinyi309/services/trackbacks/36021.html</trackback:ping><description><![CDATA[ <font size="2">Steven WeinbergQ四条黄金忠?br />    <br />Steven Weinberg 现在得克萨斯大学物理pR本文以?2003q?月在麦克基尔大学U学大会上的讲话为基?br />    <br />    当我得到大学学位的时?Q?那是癑օ十年前的事了 Q物理文献在我眼里就象一个未l探索的汪洋大vQ我必须在勘了它的每一个部分之后才能开始自q研究。做M事情之前怎么能不先了解所有已l做q了的工作呢Q万q的是,在我做研I生的第一q_我碰C一些资q物理学家Q他们不我忧心忡忡的反对,坚持我应该开始进行研IӞ而在研究的过E中学习所需的东ѝ这可是生死悠关的事。我惊讶地发C们的意见是可行的。我设法很快拿C一个博士学?Q虽然我拿到博士学位时对物理学还几乎是一无所知。不q,我的得C一个很大的教益Q?br /><br />没有Z解所有的知识Q你也不必?br />~~~~~~~~~~~~~~~~~~~~~~~~~~~<br /><br />    另一个忠告就是,如果l箋用我的vz学的比ȝ话,当你在大中搏击而不是沉没时Q应该到波涛Ҏ的地方去?9世纪60q代末,我在ȝ理工大学教书Ӟ一个学生找我说Q他惛_做广义相对论领域的研IӞ而不愿意做我所在的领域Q基本粒子物理学Q方向的研究Q原因是前者的原理已经很清楚,而后者在他看来则是一团ؕ麅R而在我看来这正是做相反决定的l好理由。粒子物理学是一个还可以做创造性工作的领域。它在那个时候的是乱麻一团,但是Q从那时P许多理论物理学家、试验物理学家的工作把这团ؕL理出来,所有的Q嗯Q几乎所有的Q知识纳入一个叫做标准模型的丽的理Z中。我的忠告是Q?br /><br />到؜q地方去,那里才是行动所在的地方?br />~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~<br />    <br />    我的W三个忠告可能是最难被接受的。这是要原谅自ph光。要求学生们解决的问题都是教授们知道可以得到解决的问题(除非教授非常地残P。而且Q这些问题在U学上是否重要是无关紧要的,Q必解决他们以通过考试。但是在现实生活中,知道哪些问题重要是非常困隄Q而且在历史某一特定时刻你根本无从知道某个问题是否有解。二十世U初Q几个重要的物理学家Q包?Lorentz ?Abraham, 惛_立一U电子理论。部分原因是Z理解Z么探地球相对以太运动的所有尝试都p|了。我们现在知道,他们研究的问题不寏V在当时Q没有h能够创立一个成功的电子理论Q因为量子力学尚未发现。需要到1905q_天才的爱因斯坦认识到正确的问题是q动在时间空间测量上的效应。沿着q条路线Q他创立了相对论。因ZM不能肯定哪个才是要研I的正确问题Q你在实验室里,在书桌前的大部分旉是会虚掷的?br /><br />如果你想要有创造性,你就必须习惯于大量时间不是创造性的Q习惯于在科学知识的h上停滞不前?br />~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~<br />    <br />    最后,学一点科学史Qv码你所研究的学U的历史。至学习科学史可能在你自己的科学研I中有点用。比如,U学家会不时因相信从Ҏ到库恩、玻普这些哲学家所提出的过分简化的U学模型而受到桎梏?br /><br />U学史的知识是科学哲学的最好解毒剂?br />~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~<br />    <br />    更重要的是,U学史的知识可以使你觉得自己的工作更有意义。作Z个科学家Q你很可能不会太富裕Q你的朋友和亲h可能也不理解你正在做的事情。而如果你研究的是象基本粒子物理学q样的领域,你甚x有是在从事一U马上就有用的工作所带来的满뀂但是,认识Cq行的科学工作是历史的一部分则可以给你带来极大的满?br />    <br />    看看100q前Q?903q。谁?903q大英帝国的首相、谁?903q美利坚合众国的ȝ在现在看来有多重要呢Q真正凸现出重要性的?1903qErnest Rutherford 和Frederick Soddy 在Mxxxxll 大学揭示了放性的本质。这一工作Q当ӞQ有实际的应用,但更加重要的是其文化含义。对攑ְ性的理解使物理学家能够解释ؓ什么几百万q以后太阛_地心仍是滚烫的。这P清除了许多地质学家和古生物学家认ؓ地球和太阛_在了很长q代的最后一个科学上的障。从此以后,基督教徒和犹太教徒就不得不或者放弃圣l的直接真理性或者放弃理性。这只是从加利略到牛ѝ达文Q直到现在削弱宗教教条主义桎梏的一pd步伐中的一步。只要读M天的M一张报U,你都会知道这一工作q没有完成。但是,q是一个文明化的工作,对这一工作U学家是可以感到骄傲的?/font> <br /> <img src ="http://www.aygfsteel.com/xinyi309/aggbug/36021.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.aygfsteel.com/xinyi309/" target="_blank">Search Engine </a> 2006-03-19 10:56 <a href="http://www.aygfsteel.com/xinyi309/archive/2006/03/19/36021.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item><item><title>Q{Q做U研应该L的好习惯 http://www.aygfsteel.com/xinyi309/archive/2006/03/19/36019.htmlSearch Engine Search Engine Sun, 19 Mar 2006 02:29:00 GMThttp://www.aygfsteel.com/xinyi309/archive/2006/03/19/36019.htmlhttp://www.aygfsteel.com/xinyi309/comments/36019.htmlhttp://www.aygfsteel.com/xinyi309/archive/2006/03/19/36019.html#Feedback0http://www.aygfsteel.com/xinyi309/comments/commentRss/36019.htmlhttp://www.aygfsteel.com/xinyi309/services/trackbacks/36019.html1.思考的习惯.大多数的人没有这U习?或是只在实验室的时候思?可是很多的有创造性的idea是在I闲的时候想到的.

2.乐观的习?有一些h是天生的乐天z?一些小事可以让他忘记很多的烦恼.做试验的时候有时侯会出现意想不到的困难,乐观是我们l前q的动力之一.

3.持之以恒的习?一些好的小的事情多坚持几次,Ş成了好的习惯.

4.交朋友的习惯.多交一些朋?很多原本很困隄事情会因为朋友的帮助q刃而解,其实交朋友只要遵循一定的原则可以了,比如说在别h有困隄时候出援助之?在实验室的一些小事上多帮助别?多与Z?心胸量开阔一?请别人吃一下饭之类.

5.创新的习?很多人没有这U习?L认ؓ别h是如何如何了不v,qx看书,看文献也是我们应该认识到别hҎ的优点与~点,扑ևH破?创新也不是很隄事情,哪怕是一点点的改q呢.

6.扑ֈ学科前沿的习?找一片篇最q发表的好文献仔l研?Ҏ参考文献找到这斚w研究的前前后?不难扑ֈ别h是如何作U研的和现在的难题之所?别h解决不了的关键问题就是学U的前沿.
  所有的习惯不是一ơ就能Ş成的,正如富兰克林所做的,一D|间内只注意养成一个好的习?当然q程有时候很痛苦,很难坚持.希望大家成功,实现自己的梦?


Search Engine 2006-03-19 10:29 发表评论
]]>
Nutch-开源搜索引?/title><link>http://www.aygfsteel.com/xinyi309/archive/2005/12/21/24988.html</link><dc:creator>Search Engine </dc:creator><author>Search Engine </author><pubDate>Wed, 21 Dec 2005 11:57:00 GMT</pubDate><guid>http://www.aygfsteel.com/xinyi309/archive/2005/12/21/24988.html</guid><wfw:comment>http://www.aygfsteel.com/xinyi309/comments/24988.html</wfw:comment><comments>http://www.aygfsteel.com/xinyi309/archive/2005/12/21/24988.html#Feedback</comments><slash:comments>1</slash:comments><wfw:commentRss>http://www.aygfsteel.com/xinyi309/comments/commentRss/24988.html</wfw:commentRss><trackback:ping>http://www.aygfsteel.com/xinyi309/services/trackbacks/24988.html</trackback:ping><description><![CDATA[1.介绍<br />nutch是一个完全开源的搜烦引擎?它的效率可以和商业搜索引擎相媲美.作ؓ一个研I^?nutch有开攄zȝ架构,用户可以制定个性化的搜索引?nutch的徏立目的是增加web搜烦的透明?<br />2.架构<br />nutch有高质量,模块化的架构特点允许使用插g来进?media-type解析,html分析,数据索协议和查询.有四个主要的模块:<br />searcher:<br />l一个查?必需快速的扑ֈ最的相关l果子集,然后呈现他们.发现一个比较大的相兛_集工作是建立一个文档集的倒排索引,排序以生最相关的文?<br />indexer:<br />创徏倒排索引,使用lucene存储倒排索引.<br />数据?<br />为烦引存储文档内?以及为搜索存储摘?伴随着像文档的链接l构q样的信?<br />Fetcher:<br />hweb面,解析他们,抽取链接.<br /><br /><br /><img src ="http://www.aygfsteel.com/xinyi309/aggbug/24988.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.aygfsteel.com/xinyi309/" target="_blank">Search Engine </a> 2005-12-21 19:57 <a href="http://www.aygfsteel.com/xinyi309/archive/2005/12/21/24988.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item><item><title>google 的PR法 http://www.aygfsteel.com/xinyi309/archive/2005/11/12/19447.htmlSearch Engine Search Engine Sat, 12 Nov 2005 02:43:00 GMThttp://www.aygfsteel.com/xinyi309/archive/2005/11/12/19447.htmlhttp://www.aygfsteel.com/xinyi309/comments/19447.htmlhttp://www.aygfsteel.com/xinyi309/archive/2005/11/12/19447.html#Feedback2http://www.aygfsteel.com/xinyi309/comments/commentRss/19447.htmlhttp://www.aygfsteel.com/xinyi309/services/trackbacks/19447.html
假设一个概率qQؓ用户q入一个随机抽取的|页的概?Q取gؓ0.15Q?BR>
1-qQ?为用戯入当前网后点当前网超链接的概?BR>
q一步假讄户不回溯先前讉K的网,q个q程可以通过构造马可夫链来实现。于是每个访问的|页的概率就可以出来?BR>
设CQaQؓa|页包含的超链接数量Q也是outing link .

设p1  到pn  为指向网a的网|??BR>
于是|页a的PRgؓQ?BR>
PRQaQ?q+ (1-q){ 西格玛i?到n [PR(Pi)/C(Pi)] }

通过公式可以看出C(Pi)的值是已知的,也就是说前h已经好??nbsp; 

|页的PRg用是QCrawling可以Ҏ|页的PR值去抓优质的|页?BR>
所以可以看出网设计者应该设计描q性强的网|题,头信息,原数据,和好的超链接?BR>
q是我翻译的一文献的一部分Q希望能l大家提供一些帮助?


Search Engine 2005-11-12 10:43 发表评论
]]>
转蝲 lucene ?http://www.aygfsteel.com/xinyi309/archive/2005/11/10/19083.htmlSearch Engine Search Engine Thu, 10 Nov 2005 00:45:00 GMThttp://www.aygfsteel.com/xinyi309/archive/2005/11/10/19083.htmlhttp://www.aygfsteel.com/xinyi309/comments/19083.htmlhttp://www.aygfsteel.com/xinyi309/archive/2005/11/10/19083.html#Feedback0http://www.aygfsteel.com/xinyi309/comments/commentRss/19083.htmlhttp://www.aygfsteel.com/xinyi309/services/trackbacks/19083.html阅读全文

Search Engine 2005-11-10 08:45 发表评论
]]>
转蝲lucene 一http://www.aygfsteel.com/xinyi309/archive/2005/11/10/19082.htmlSearch Engine Search Engine Thu, 10 Nov 2005 00:43:00 GMThttp://www.aygfsteel.com/xinyi309/archive/2005/11/10/19082.htmlhttp://www.aygfsteel.com/xinyi309/comments/19082.htmlhttp://www.aygfsteel.com/xinyi309/archive/2005/11/10/19082.html#Feedback0http://www.aygfsteel.com/xinyi309/comments/commentRss/19082.htmlhttp://www.aygfsteel.com/xinyi309/services/trackbacks/19082.html Lucene.Net pd一 PDF文档 打印 E-mail
作?idior   
2005-03-16 22:36

本文介绍了什么是Lucene,Lucene能做什?

如何从一个文件夹下的所有txt文g中查扄定的?

本文围l该个实例介l了lucene.net的烦引的建立以及如何针对索引q行搜烦.最后还给出源代码供大家学?

源代码下?/FONT>

What’s Lucene
Lucene是一个信息检索的函数?Library),利用它你可以Z的应用加上烦引和搜烦的功?

Lucene的用者不需要深入了解有兛_文检索的知识,仅仅学会使用库中的一个类,你就Z的应用实现全文检索的功能.

不过千万别以为Lucene是一个象google那样的搜索引?Lucene甚至不是一个应用程?它仅仅是一个工?一个Library.你也可以把它理解Z个将索引,搜烦功能装的很好的一套简单易用的API.利用q套API你可以做很多有关搜烦的事?而且很方?

What Can Lucene Do

Lucene可以对Q何的数据做烦引和搜烦. Lucene不管数据源是什么格?只要它能被{化ؓ文字的Ş?可以被Lucene所分析利用.也就是说不管是MS word, Html ,pdfq是其他什么Ş式的文g只要你可以从中抽取出文字形式的内容就可以被Lucene所?你就可以用Lucene对它们进行烦引以及搜?

How To Use Lucene --- A Simple Example
CZ介绍:

Z入参数的文g夹下的所有txtcd的文件做索引,做好的烦引文件放入index文g?

然后在烦引的基础上对文gq行全文搜烦.

1.       建立索引
IndexWriter writer = new IndexWriter("index", new StandardAnalyzer(), true);
IndexDocs(writer, new System.IO.FileInfo(args[0]));              
writer.Optimize();
writer.Close();

IndexWriter是对索引q行写操作的一个类,利用它可以创Z个烦引对象然后往其中d文g.需要注意它q不是唯一可以修改索引的类.在烦引徏好后利用其他c还可以对其q行修改.

构造函数第一个参数是建立的烦引所要放的文件夹的名?W二个参数是一个分析对?主要用于从文本中抽取那些需要徏立烦引的内容,把不需要参与徏索引的文本内容去?比如L一些a the之类的常用词,q有军_是否大小写敏?不同的选项通过指定不同的分析对象控?W三个参数用于确定是否覆盖原有烦引的.

W二步就是利用这个writer往索引中添加文?具体后面再说.

W三步进行优?

W四步关闭writer.

 

下面具体看看W二?

   public static void IndexDirectory(IndexWriter writer, FileInfo file)
         {
              if (Directory.Exists(file.FullName))
              {
                   String[] files = Directory.GetFileSystemEntries(file.FullName);
                   // an IO error could occur
                   if (files != null)
                   {
                       for (int i = 0; i < files.Length; i++)
                       {
                            IndexDirectory(writer, new FileInfo(files[i]));  //q里是一个递归

                       }
                   }
              }
              else if (file.Extension == ".txt")
              {
                   IndexFile(file, writer);
              }
         }

 

         private static void IndexFile(FileInfo file, IndexWriter writer)
         {
              Console.Out.WriteLine("adding " + file);
              try
              {
                   Document doc = new Document();                   
                   doc.Add(Field.Keyword("filename", file.FullName));

                   doc.Add(Field.Text("contents", new StreamReader(file.FullName)));

                   writer.AddDocument(doc);
              }
             
              catch (FileNotFoundException fnfe)
              {
                  
              }
     }

主要是两个函数一个用于处理文件夹(不是为文件夹建立索引),一个用于真正ؓ文g建立索引.

因此主要集中看一下IndexFileq个Ҏ.首先建立Document对象,然后为Document对象d一些属性Field.你可以把Document对象看成是虚拟文?来从此获取信?而Field则看成是描述此虚拟文件的元数?metadata).

其中Field包括四个cd:

Keywork

该类型的数据不被分?而会被烦引ƈ保存保存在烦引中.
UnIndexed
该类型的数据不会被分析也不会被烦?但是会保存在索引.
UnStored
和UnIndexed刚好相反,被分析被索引,但是不被保存.
Text
和UnStroredcM.如果值的cd为stringq会被保?如果值的cdReader׃会被保存和UnStored一?

 

最后将每一个Documentd到烦引当?

需要注意的是烦引不仅可以徏立在文gpȝ?也可以徏立在内存?

例如

IndexWriter writer = new IndexWriter("index", new StandardAnalyzer(), true);

在第一个参C是指定文件夹的名字而是使用Directory对象,q用它的子cRAMDirectory,可以将索引建立在内存当?

 

2.       对烦引进行搜?/STRONG>

IndexSearcher indexSearcher= new IndexSearcher(indexDir);
Query query = QueryParser.Parse(queryString, "contents",new StandardAnalyzer());
Hits hits = indexSearcher.Search(query);

 W一步利用IndexSearcher打开索引文g用于后面搜烦,其中的参数是索引文g的\?

W二步用QueryParser可L较好的查询语句(比如查询的词lucene ,以及一些高U方式lucene AND .net)转化为Lucene内部使用的查询对?

W三步执行搜?q将l果q回到hits集合.需要注意的是Luceneq不是一ơ将所有的l果攑օhits中而是采取一ơ放一部分的方?ZI间考虑.



Search Engine 2005-11-10 08:43 发表评论
]]>
索引技?/title><link>http://www.aygfsteel.com/xinyi309/archive/2005/11/09/19051.html</link><dc:creator>Search Engine </dc:creator><author>Search Engine </author><pubDate>Wed, 09 Nov 2005 13:27:00 GMT</pubDate><guid>http://www.aygfsteel.com/xinyi309/archive/2005/11/09/19051.html</guid><wfw:comment>http://www.aygfsteel.com/xinyi309/comments/19051.html</wfw:comment><comments>http://www.aygfsteel.com/xinyi309/archive/2005/11/09/19051.html#Feedback</comments><slash:comments>1</slash:comments><wfw:commentRss>http://www.aygfsteel.com/xinyi309/comments/commentRss/19051.html</wfw:commentRss><trackback:ping>http://www.aygfsteel.com/xinyi309/services/trackbacks/19051.html</trackback:ping><description><![CDATA[    当文本信息库的容量很大时Q如果要快速有效的获取文本Q那么就需要用特定的索引技术,一U简单而且常用的文本烦引结构是倒排文g。如果搜索过E是以简单的单词匚w实施的,那么Z倒排文g的烦引结构就能满回总需求。这U基于单词匹配的查询方式在目前的信息获取pȝ中用得比较普遍?BR>   <BR>    一个典型的倒排文g由如下几部分l成Q?BR><BR>Q?Q一个包含信息库中的文本中所有不同单词(也叫作词汇表Q的向量Q?BR><BR>Q?Q对于词汇表中的每个单词Q有一U包含这个单词的所有文档(用文档号来标识)l成的列表。每个列表中的文档根据文档号的大升序排列。查询执行的旉与访问烦引所需要的旉密切相关?<img src ="http://www.aygfsteel.com/xinyi309/aggbug/19051.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.aygfsteel.com/xinyi309/" target="_blank">Search Engine </a> 2005-11-09 21:27 <a href="http://www.aygfsteel.com/xinyi309/archive/2005/11/09/19051.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item></channel></rss> <footer> <div class="friendship-link"> <a href="http://www.aygfsteel.com/" title="狠狠久久亚洲欧美专区_中文字幕亚洲综合久久202_国产精品亚洲第五区在线_日本免费网站视频">狠狠久久亚洲欧美专区_中文字幕亚洲综合久久202_国产精品亚洲第五区在线_日本免费网站视频</a> </div> </footer> վ֩ģ壺 <a href="http://" target="_blank">կ</a>| <a href="http://" target="_blank">״</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">ɽ</a>| <a href="http://" target="_blank">ˮ</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">˱</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">཭</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">˳</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">ɳ</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">ƽ</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">«</a>| <a href="http://" target="_blank">Т</a>| <a href="http://" target="_blank">˫</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">ȫ</a>| <a href="http://" target="_blank">ʡ</a>| <a href="http://" target="_blank">ƽ</a>| <a href="http://" target="_blank">Ԫ</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">̩</a>| <a href="http://" target="_blank">ȫ</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank">̶</a>| <a href="http://" target="_blank">˳ƽ</a>| <a href="http://" target="_blank">¡</a>| <a href="http://" target="_blank"></a>| <a href="http://" target="_blank"></a>| <script> (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })(); </script> </body>