中文字幕最新精品,国产精品一卡二卡三卡,久久精品国产亚洲一区二区

Map Reduce - the Free Lunch is not over?

weidagang2046 — Mon, 08 Jan 2007 12:48:00 GMT

微��Y著名的C++大师Herb Sutter�?005�q�初的时候曾�l�写�q�一��重量��的文章：(x��)�?a >The Free Lunch Is Over: A Fundamental Turn Toward Concurrency in Software“，预言OO之后软�g开发将要面临的又一�ơ重大变�?�q�行计算�?/p>

摩尔定律�l�制下的软�g开发时代有一个非常有意思的现象�Q�”Andy giveth, and Bill taketh away.”。不��CPU的主频有多快�Q�我们始�l�有办法来利用它�Q�而我们也陉��在机器升�U�带来的�E�序性能提高中�?/p>

我记着我大二的时候曾�l�做�q�一个五子棋的程序，当时的算法就是预先设计一些棋型（有优先��Q�，然后扫描��盘�Q�对形势�q�行分析�Q�看看当前走哪部对自己最重要。当然下��还要堵别�h�Q�这��需要互换双方的��型再计��。如果只��一步，很可能被狡猾的对手欺骗，所以�ؓ(f��)�?ji��n)多惛_��步，�q�需要递归和回朔。在当时的机器上�Q�算3步就基本上需�?�U�左右的旉��?ji��n)。后来大学毕业收拾东西的时候找到这个程序，试了(ji��n)一下，发现��?0步需要的旉��也基本上感觉不出来了(ji��n)�?/p>

不知道你是否有同��L(f��ng)��l�历�Q�我们不知不觉的一直在享受着�q�样的免费午��。可是，随着摩尔定律的提前终�l�，免费的午��终�I�要�q�回厅R��虽然硬件设计师�q�在努力�Q�Hyper Threading CPU�Q�多��Z��套寄存器�Q�相当于一个逻辑CPU�Q��得Pipeline��可能满负荷�Q��多个Thread的操作有可能�q�行�Q��得多�U�程�E�序的性能�?%-15%的提升；增加Cache定w��也��得包括Single-Thread和Multi-Thread�E�序都能受益。也许这些还能帮助你一�D�|��_(d��)��但问题是�Q�我们必��d��出改变，面对�q�个卛_��到来的变革，你准备好�?ji��n)么�Q?/p>

Concurrency Programming != Multi-Thread Programming。很多�h都会(x��)说MultiThreading谁不�?x��)，问题是，你是��Z��么��?如何使用多线�E�的�Q�我从前做过一个类似AcdSee一��L(f��ng)��囑փ�查看/处理�E�序�Q�我通常用它来处理我的数码照片。我在里面用�?ji��n)大量的多线�E�，不过主要目的是在囑փ�处理的时候不要Block住UI�Q�所以将CPU Intensive的计��部分用后台�U�程�q�行处理。而�ƈ没有把对囑փ�矩阵的运��ƈ行分开�?/p>

我觉得Concurrency Programming真正的挑战在于Programming Model的改变，在程序员的脑子里面要对自��q��E�序怎样�q�行化有很清楚的认识�Q�更重要的是�Q�如何去实现�Q�包括架构、容错、实时监控等�{�）(j��)�q�种�q�行化，如何�?strong>调试�Q�如何去��试�?/p>

在Google�Q�每天有��量的数据需要在有限的时间内�q�行处理�Q�其实每个互联网公司都会(x��)��到�q�样的问题）(j��)�Q�每个程序员都需要进行分布式的程序开发，�q�其中包括如何分布、调度、监控以�?qi��ng)容错等�{�。Google�?a >MapReduce正是把分布式的业务逻辑从这些复杂的�l�节中抽象出来，使得没有或者很��ƈ行开发经验的�E�序员也能进行�ƈ行应用程序的开发�?/p>

MapReduce中最重要的两个词��是Map�Q�映��）(j��)和Reduce�Q�规�U�）(j��)。初看Map/Reduce�q�两个词�Q�熟�(zh��n)�Function Language的�h一定感觉很熟�?zh��n)�。FP把这��L(f��ng)��函数�U�Cؓ(f��)”higher order function”（”High order function”被成�ؓ(f��)Function Programming的利器之一哦）(j��)�Q�也��是��_(d��)��q�些函数是编写来被与其它函数相结合（或者说被其它函数调用的�Q�。如果说��要比的化，可以把它惌��成C里面的CallBack函数�Q�或者STL里面的Functor。比如你要对一个STL的容器进行查找，需要制定每两个元素相比较的Functor�Q�Comparator�Q�，�q�个Comparator在遍历容器的时候就�?x��)被调用�?/p>

拿前面说�q�图像处理程序来举例�Q�其实大多数的图像处理操作都是对囑փ�矩阵�q�行某种�q�算。这里的�q�算通常有两�U�，一�U�是映射�Q�一�U�是规约。拿两种效果来说�Q�”老照片”效果通常是强化照片的G/B��|��然后�Ҏ(gu��)��个象素加一些随机的偏移�Q�这些操作在二维矩阵上的每一个元素都是独立的�Q�是Map操作。而”雕删Z��效果需要提取图像边�~�，��需要元素之间的�q�算�?ji��n)，是一�U�Reduce操作。再举个��单的例子�Q�一个一�l�矩阵（数组�Q�[0,1,2,3,4]可以映射为[0,2,3,6,8]�Q�乘2�Q�，也可以映��ؓ(f��)[1,2,3,4,5]�Q�加1�Q�。它可以规约�?�Q�元素求�U�）(j��)也可以规�U��ؓ(f��)10�Q�元素求和）(j��)�?/p>

面对复杂问题�Q�古人教导我们要�?strong>�?/strong>�?strong>�?/strong>之”，英文中对应的词是�?strong>Divide and Conquer“。Map/Reduce其实��是Divide/Conquer的过�E�，通过把问题Divide�Q��ɘq�些Divide后的Map�q�算高度�q�行�Q�再��Map后的�l�果Reduce�Q�根据某一个Key�Q�，得到最�l�的�l�果�?/p>

Googler发现�q�是问题的核�?j��)，其它都是共性问题。因此，他们把MapReduce抽象分离出来。这��P��Google的程序员可以只关�?j��)应用逻辑�Q�关�?j��)根据哪些Key把问题进行分解，哪些操作是Map操作�Q�哪些操作是Reduce操作。其它�ƈ行计��中的复杂问题诸如分布、工作调度、容错、机器间通信都交�l�Map/Reduce Framework��d��Q�很大程度上��化了(ji��n)整个�~�程模型�?/p>

MapReduce的另一个特�Ҏ(gu��)��Q�Map和Reduce�?strong>输入和输出都是中间��(f��)时文�?/strong>�Q�MapReduce利用Google文�g�pȝ��来管理和讉K��q�些文�g�Q�，而不是不同进�E�间或者不同机器间的其它通信方式。我觉得�Q�这是Google一贯的风格�Q�化�J��ؓ(f��)��Q�返璞归真�?/p>

接下来就放下其它�Q�研�I�一下Map/Reduce操作。（其它比如定w��、备份�Q务也有很�l�典的经验和实现�Q�论文里面都有详�q�ͼ�(j��)

Map的定义：(x��)

Map, written by the user, takes an input pair and produces a set of intermediate key/value pairs. The MapReduce library groups together all intermediate values associated with the same intermediate key I and passes them to the Reduce function.

Reduce的定义：(x��)

The Reduce function, also written by the user, accepts an intermediate key I and a set of values for that key. It merges together these values to form a possibly smaller set of values. Typically just zero or one output value is produced per Reduce invocation. The intermediate values are supplied to the user’s reduce function via an iterator. This allows us to handle lists of values that are too large to fit in memory.

MapReduce论文中给��Z��(ji��n)�q�样一个例子：(x��)在一个文档集合中�l�计每个单词出现的次数�?/p>

Map操作的输入是每一��文档，��输入文档中每一个单词的出现输出��C��间文件中厅R�?/p>

map(String key, String value):
    // key: document name
    // value: document contents
    for each word w in value:
        EmitIntermediate(w, �?�?;

比如我们有两��文档，内容分别�?/p>

A �Q?“I love programming�?/p>

B �Q?“I am a blogger, you are also a blogger”�?/p>

B文档�l�过Map�q�算后输出的中间文�g��会(x��)是：(x��)

	I,1
	am,1
	a,1
	blogger,1
	you,1
	are,1
	a,1
	blogger,1

Reduce操作的输入是单词和出现次数的序列。用上面的例子来��_(d��)��是 (”I�? [1, 1]), (”love�? [1]), (”programming�? [1]), (”am�? [1]), (”a�? [1,1]) �{�。然后根据每个单词，��出�ȝ��出现�ơ数�?/p>

reduce(String key, Iterator values):
    // key: a word
    // values: a list of counts
    int result = 0;
    for each v in values:
        result += ParseInt(v);
    Emit(AsString(result));

最后输出的最�l�结果就�?x��)是�Q?”I�? 2�?, (”a�? 2�?…�?/p>

实际的执行顺序是�Q?/p>

MapReduce Library��Input分成M份。这里的Input Splitter也可以是多台机器�q�行Split�?
Master��M份Job分给Idle状态的M个worker来处理；
对于输入中的每一�?lt;key, value> pair �q�行Map操作�Q�将中间�l�果Buffer在Memory里；
定期的（或者根据内存状态）(j��)�Q�将Buffer中的中间信息Dump�?strong>本地��盘上，�q�且把文件信息传回给Master�Q�Master需要把�q�些信息发送给Reduce worker�Q�。这里最重要的一�Ҏ(gu��)��Q?strong>在写��盘的时候，需要将中间文�g做Partition�Q�比如R个）(j��)。拿上面的例子来举例�Q�如果把所有的信息存到一个文�Ӟ��Reduce worker又会(x��)变成瓉��。我们只需要保�?strong>相同Key能出现在同一个Partition里面��可以把�q�个问题分解�?
R个Reduce worker开始工作，从不同的Map worker的Partition那里拿到数据�Q?strong>read the buffered data from the local disks of the map workers�Q�，用key�q�行排序�Q�如果内存中放不下需要用到外部排�?- external sort�Q�。很昄��Q�排序（或者说Group�Q�是Reduce函数之前必须做的一步�?�q�里面很关键的是�Q�每个Reduce worker�?x��)去从很多Map worker那里拿到X(0
Reduce worker遍历中间数据�Q�对每一个唯一Key�Q�执行Reduce函数�Q�参数是�q�个key以及(qi��ng)相对应的一�p�d��Value�Q��?
执行完毕后，唤醒用户�E�序�Q�返回结果（最后应该有R份Output�Q�每个Reduce Worker一个）(j��)�?

可见�Q�这里的分（Divide�Q�体现在两步�Q�分别是��输入分成M份，以及(qi��ng)��Map的中间结果分成R份。将输入分开通常很简单，Map的中间结果通常用”hash(key) mod R”这个结果作为标准，保证相同的Key出现在同一个Partition里面。当�?d��ng)��使用者也可以指定自己的Partition Function�Q�比如，对于Url Key�Q�如果希望同一个Host的URL出现在同一个Partition�Q�可以用”hash(Hostname(urlkey)) mod R”作为Partition Function�?/p>

对于上面的例子来��_(d��)��每个文档中都可能�?x��)出现成千上万�?(”the�? 1)�q�样的中间结果，琐碎的中间文件必然导致传输上的损失。因此，MapReduce�q�支持用��h��供Combiner Function。这个函数通常与Reduce Function有相同的实现�Q�不同点在于Reduce函数的输出是最�l�结果，而Combiner函数的输出是Reduce函数的某一个输入的中间文�g�?/p>

Tom White�l�出�?ji��n)Nutch[2]中另一个很直观的例子，分布式Grep。我一直觉得，Pipe中的很多操作�Q�比如More、Grep、Cat都类��g��一�U�Map操作�Q�而Sort、Uniq、wc�{�都相当于某�U�Reduce操作�?/p>

加上前两天Google刚刚发布�?a >BigTable论文�Q�现在Google有了(ji��n)自己的集��?- Googel Cluster�Q�分布式文�g�pȝ�� - GFS�Q�分布式计算环境 - MapReduce�Q�分布式�l�构化存�?- BigTable�Q�再加上Lock Service。我真的能感觉的到Google著名的免�Ҏ(gu��)��之外的对于�E�序员的另一�U�免费的晚餐�Q�那个由大量的commodity PC�l�成的large clusters。我觉得�q�些才真正是Google的核�?j��)�h(hu��n)值所在�?/p>

呵呵�Q�就像微软老兵Joel Spolsky�Q�你应该看过他的”Joel on Software”吧�Q�）(j��)曄��说过�Q�对于微软来说最可怕的是[1]�Q�微软还在苦苦追赶Google来完善Search功能的时候，Google已经在部�|�下一代的��计算��Z��(ji��n)�?/p>

The very fact that Google invented MapReduce, and Microsoft didn’t, says something about why Microsoft is still playing catch up trying to get basic search features to work, while Google has moved on to the next problem: building Skynet^H^H^H^H^H^H the world’s largest massively parallel supercomputer. I don’t think Microsoft completely understands just how far behind they are on that wave.

�?�Q�其实，微��Y也有自己的方�?- DryAd。问题是�Q�大公司里，要想重新部��v�q�样一个底层的InfraStructure�Q�无论是技术的原因�Q�还是政�ȝ��原因�Q�将是如何的难�?/p>

�?�Q?a >Lucene之父Doug Cutting的又一力作�Q�Project Hadoop - 由Hadoop分布式文件系�l�和一个Map/Reduce的实现组成，Lucene/Nutch的成产线也够齐全的了(ji��n)�?br />
from: http://xerdoc.com/blog/archives/246.html

weidagang2046 2007-01-08 20:48 发表评论

Can Your Programming Language Do This?

weidagang2046 — Mon, 08 Jan 2007 12:22:00 GMT

This item ran on the Joel on Software homepage on Tuesday, August 01, 2006

One day, you're browsing through your code, and you notice two big blocks that look almost exactly the same. In fact, they're exactly the same, except that one block refers to "Spaghetti" and one block refers to "Chocolate Moose."

    // A trivial example:
    
    alert("I'd like some Spaghetti!");
    alert("I'd like some Chocolate Moose!");

These examples happen to be in JavaScript, but even if you don't know JavaScript, you should be able to follow along.

The repeated code looks wrong, of course, so you create a function:

    function SwedishChef( food )
    {
        alert("I'd like some " + food + "!");
    }
	
    SwedishChef("Spaghetti");
    SwedishChef("Chocolate Moose");

OK, it's a trivial example, but you can imagine a more substantial example. This is better code for many reasons, all of which you've heard a million times. Maintainability, Readability, Abstraction = Good!

Now you notice two other blocks of code which look almost the same, except that one of them keeps calling this function called BoomBoom and the other one keeps calling this function called PutInPot. Other than that, the code is pretty much the same.

    alert("get the lobster");
    PutInPot("lobster");
    PutInPot("water");

    alert("get the chicken");
    BoomBoom("chicken");
    BoomBoom("coconut");

Now you need a way to pass an argument to the function which itself is a function. This is an important capability, because it increases the chances that you'll be able to find common code that can be stashed away in a function.

    function Cook( i1, i2, f )
    {
        alert("get the " + i1);
        f(i1);
        f(i2);
    }

    Cook( "lobster", "water", PutInPot );
    Cook( "chicken", "coconut", BoomBoom );

Look! We're passing in a function as an argument.

Can your language do this?

Wait... suppose you haven't already defined the functions PutInPot or BoomBoom. Wouldn't it be nice if you could just write them inline instead of declaring them elsewhere?

    Cook( "lobster", 
          "water", 
          function(x) { alert("pot " + x); }  );
    Cook( "chicken", 
          "coconut", 
          function(x) { alert("boom " + x); } );

Jeez, that is handy. Notice that I'm creating a function there on the fly, not even bothering to name it, just picking it up by its ears and tossing it into a function.

As soon as you start thinking in terms of anonymous functions as arguments, you might notice code all over the place that, say, does something to every element of an array.

    var a = [1,2,3];
	
    for (i=0; i
		Doing something to every element of an array is pretty common, and you can write a function that does it for you:
		    function map(fn, a)
    {
        for (i = 0; i < a.length; i++)
        {
            a[i] = fn(a[i]);
        }
    }

		Now you can rewrite the code above as:
		    map( function(x){return x*2;}, a );
    map( alert, a );

		Another common thing with arrays is to combine all the values of the array in some way. 
		    function sum(a)
    {
        var s = 0;
        for (i = 0; i < a.length; i++)
            s += a[i];
        return s;
    }
    
    function join(a)
    {
        var s = "";
        for (i = 0; i < a.length; i++)
            s += a[i];
        return s;
    }
    
    alert(sum([1,2,3]));
    alert(join(["a","b","c"]));

		
				sum and join look so similar, you might want to abstract out their essence into a generic function that combines elements of an array into a single value:
		    function reduce(fn, a, init)
    {
        var s = init;
        for (i = 0; i < a.length; i++)
            s = fn( s, a[i] );
        return s;
    }
    
    function sum(a)
    {
        return reduce( function(a, b){ return a + b; }, 
                       a, 0 );
    }
    
    function join(a)
    {
        return reduce( function(a, b){ return a + b; }, 
                       a, "" );
    }


		Many older languages simply had no way to do this kind of stuff. Other languages let you do it, but it's hard (for example, C has function pointers, but you have to declare and define the function somewhere else). Object-oriented programming languages aren't completely convinced that you should be allowed to do anything with functions. 
		Java required you to create a whole object with a single method called a functor if you wanted to treat a function like a first class object. Combine that with the fact that many OO languages want you to create a whole file for each class, and it gets really klunky fast. If your programming language requires you to use functors, you're not getting all the benefits of a modern programming environment. See if you can get some of your money back.
		How much benefit do you really get out of writting itty bitty functions that do nothing more than iterate through an array doing something to each element?
		Well, let's go back to that map function. When you need to do something to every element in an array in turn, the truth is, it probably doesn't matter what order you do them in. You can run through the array forward or backwards and get the same result, right? In fact, if you have two CPUs handy, maybe you could write some code to have each CPU do half of the elements, and suddenly map is twice as fast.
		Or maybe, just hypothetically, you have hundreds of thousands of servers in several data centers around the world, and you have a really big array, containing, let's say, again, just hypothetically, the entire contents of the internet. Now you can run map on thousands of computers, each of which will attack a tiny part of the problem.
		So now, for example, writing some really fast code to search the entire contents of the internet is as simple as calling the map function with a basic string searcher as an argument. 
		The really interesting thing I want you to notice, here, is that as soon as you think of map and reduce as functions that everybody can use, and they use them, you only have to get one supergenius to write the hard code to run map and reduce on a global massively parallel array of computers, and all the old code that used to work fine when you just ran a loop still works only it's a zillion times faster which means it can be used to tackle huge problems in an instant.
		Lemme repeat that. By abstracting away the very concept of looping, you can implement looping any way you want, including implementing it in a way that scales nicely with extra hardware. 
		And now you understand something I wrote a while ago where I complained about CS students who are never taught anything but Java:
		
				Without understanding functional programming, you can't invent MapReduce, the algorithm that makes Google so massively scalable. The terms Map and Reduce come from Lisp and functional programming. MapReduce is, in retrospect, obvious to anyone who remembers from their 6.001-equivalent programming class that purely functional programs have no side effects and are thus trivially parallelizable. The very fact that Google invented MapReduce, and Microsoft didn't, says something about why Microsoft is still playing catch up trying to get basic search features to work, while Google has moved on to the next problem: building Skynet^H^H^H^H^H^H the world's largest massively parallel supercomputer. I don't think Microsoft completely understands just how far behind they are on that wave.
		
		Ok. I hope you're convinced, by now, that programming languages with first-class functions let you find more opportunities for abstraction, which means your code is smaller, tighter, more reusable, and more scalable. Lots of Google applications use MapReduce and they all benefit whenever someone optimizes it or fixes bugs.
		And now I'm going to get a little bit mushy, and argue that the most productive programming environments are the ones that let you work at different levels of abstraction. Crappy old FORTRAN really didn't even let you write functions. C had function pointers, but they were ugleeeeee and not anonymous and had to be implemented somewhere else than where you were using them. Java made you use functors, which is even uglier. As Steve Yegge points out, Java is the Kingdom of Nouns.
		
				
						Correction: The last time I used FORTRAN was 27 years ago. Apparently it got functions. I must have been thinking about GW-BASIC.
				
		
		

		

		

		

		About the Author: I'm your host, Joel Spolsky, a software developer in New York City. Since 2000, I've been writing about software development, management, business, and the Internet on this site. For my day job, I run Fog Creek Software, makers of FogBugz - the smart bug tracking software with the stupid name, and Fog Creek Copilot - the easiest way to provide remote tech support over the Internet, with nothing to install or configure. 

from: http://www.joelonsoftware.com/items/2006/08/01.html

weidagang2046 2007-01-08 20:22 发表评论

Partial Evaluation - An Overview

weidagang2046 — Fri, 15 Dec 2006 06:40:00 GMT

Program specialization
- General Idea
- Examples (in Scheme or in C)
- Interest
Partial evaluation

Program Specialization

Let us consider a program P, taking two arguments S and D, and producing a result R:

run P(S,D) = R

A specialization of P with respect to S is a program P_S such that, for all input D,

run P_S(D) = run P(S,D) = R

Input S is called static, it is known (i.e., available) at specialization time. Input D is dynamic, it is unknown (i.e., unavailable) until run time.

Specialization Examples

Program specialization makes sense in any programming language. Consider for example the following Scheme program. (See below for more examples, in C.)

(define (append list1 list2)
   (if (null? list1)
       list2
       (cons (car list1) (append (cdr list1) list2))))

A possible specialization of append with respect to a static argument list1 = (4 2) is function append42 below.

(define (append42 list2)
   (cons 4 (cons 2 list2)))

Function append42 preserves the semantics of append, or more precisely, it has the same semantics as the trivial specialization function triv_append42, defined as

(define (triv-append42 list2)
   (append '(4 2) list2))

Depending on the context, S is called a specialization value or an invariant. In the general case, a specialization may exploit several invariants, whether input values or constants already present in the code of P.

Interest of Specialization

The interest of function append42 above, as opposed to triv-append42, is that computations depending only on the static input list1 = (4 2) have already been performed. More generally, specialization impacts on speed and size of programs, thus offering applications to program optimization.

Speed: Specialization factors out computations from the specialized program. As a result, a specialized program runs faster than the original program. (Although, in some rare cases, cache effects may yield a slight slowdown.) For example, function append42 above runs faster than append (or more precisely, triv-append42) because the traversal of argument list1 as already been performed.
Size: A specialized program is sometimes smaller than the original program (e.g., when a static input corresponds to an option that dispatches on different functionalities of the program). It is sometimes bigger (e.g., when a loop or a recursive call is unfolded).

Note that all program arguments do not have the same impact on specialization. For example, specializing append with respect to list2 = (4 2) leads to the quite unexciting function below.

(define (dull-append42 list1)
   (if (null? list1)
       '(4 2)
       (cons (car list1) (dull-append42 (cdr list1)))))

Specialization is used in particular (sometimes unknowingly) to optimize critical sections of code. It is often handwritten.

Partial Evaluation

Partial evaluation (PE) is the process that automates program specialization [CD93, DRT96, JGS93]. A partial evaluator (or specializer) is a program M that takes two arguments, the source of a program P and a static (known) subset of the input S, and produces a specialized program P_S:

run M(P,S) = P_S

Roughly speaking, partial evaluation can be thought of as a combination of aggressive constant folding, inlining, loop unrolling and inter-procedural constant propagation applied to all data types (including pointers, structures and arrays) instead of just scalars.

Applications of Partial Evaluation

Handwritten specialization is tedious, error-prone and does not scale to large programs. Because it is automatic, specialization via partial evaluation does not have all those drawbacks; it is even predictable (see below). As a result, specialization becomes an issue in engineering software: it is possible to rapidly write generic programs, which are maintainable but slow, and automatically produce fast specialized instances. Because the programmer focuses less on optimization hacks, and more on reusability, partial evaluation greatly improve productivity and program safety.

Partial evaluation has been successfully applied as an optimizer in various domains such as operating systems and networking, computer graphics, numerical computation, circuit simulation, software architectures, compiling and compiler generation.

It has also been used for program understanding and reengineering: given various running options, partial evaluation may split large programs into smaller ones.

Off-line vs. On-line Partial Evaluation

An on-line partial evaluator takes as arguments the source of a program P and a static subset of the input S, performs symbolic computations on available data, and directly yields the source of a specialized program P_S.

In an off-line partial evaluator, the specialization is divided into two steps. First, an program binding-time analysis propagate abstract information about static and dynamic values throughout the code. It prepares the second phase that, given actual specialization values, produce specialized code.

On-line partial evaluator are theoretically more powerful: specialization relies on actual values, not on the fact that values are known. On the other hand, off-line partial evaluator are faster because value propagation is "pre-compiled". Moreover, they are predictable in the sense that it is possible to assess the degree of specialization.

Some partial evaluators, like Tempo, can specialize programs not only at compile time (i.e., source-to-source transformation) but also run time (i.e., run-time code generation). Only off-line partial evaluation lends itself to run-time specialization.

Binding-Time Analysis

As a first step, the user provides a program and specifies initial binding times, that is, which arguments (including global variables) are static (i.e., known) and which are dynamic (i.e., yet unknown). For example, the user provides the following code for a miniprintf function, and specifies that the first argument is static whereas the second is dynamic: miniprintf(S,D).

miniprintf(char fmt[], int val[])
{
  int i = 0;
  while( *fmt != '\0' ) {
    if( *fmt != '%' )
       putchar(*fmt);
    else
      switch(*++fmt) {
        case 'd' : putint(val[i++]); break;             
        case '%' : putchar('%');     break;
        default  : prterror(*fmt);   break;
      }
    fmt++;
  }
}

Binding-time analysis (BTA) propagates the static/dynamic information throughout the program and annotates each statement and expression with a binding time. These annotations can be visualized using colors (or font effects).

/*  LEGEND:  STATICDYNAMIC
 */
miniprintf(char fmt[],int val[]){int i = 0;while( *fmt != '\0' ) {if( *fmt != '%' )putchar(*fmt);elseswitch(*++fmt) {case 'd' :putint(val[i++]);break;case '%' :putchar('%');break;default  :prterror(*fmt);break;}fmt++;}}

The blue color (bold face for black and white display) represent static constructions, i.e. values that can be computed at specialization time. The red color (standard font for black and white display) is for dynamic expressions, whose value cannot be precomputed knowing only the static arguments. Basically, everything in blue (bold) will disappear after specialization; only red (standard font) parts will remain. Visualizing of the analysis is very important for the user to assess the amount of specialization in the code.

Note that in the case of languages like C, the binding-time analysis must takes into account pointer aliases and side-effects.

Compile-Time Specialization

When the user is satisfied with the analysis (i.e., what the user expects to specialize is indeed considered as static by the BTA), actual specialization values must be provided. For example, giving "<%d|%d>" as the actual specialization value for the fmt argument of the miniprintf() function yields the following specialized code.

miniprintf_1(int val[])
{
  putchar( '<'    );
  putint ( val[0] );
  putchar( '|'    );
  putint ( val[1] );
  putchar( '>'    );
}

Many specializations can be performed, sharing the same analysis. Only different specialization values have to be provided.

Run-Time Specialization

Partial evaluators like Tempo [CHL+98,CHN+96] can also perform run-time specialization [CN96], using optimized binary code templates [NHCL97]. A dedicated run-time specializer is generated from the results of the program analysis. In the case of the miniprintf function, a runtime specializer rts_miniprintf() is generated, which can be used as in the following example.

/* * Some dynamic execution context setting variable 'format' */
spec_printf = rts_miniprintf(format);  // specialize
...
(*spec_printf)(val1);  // <=> miniprintf(format,val1)
(*spec_printf)(val2);  // <=> miniprintf(format,val2)

The function rts_miniprintf() is a dedicated runtime specializer. It returns a pointer to the specialized function. Several specialized versions can also be generated and used at the same time.

References

Various resources concerning partial evaluation, including existing specializers, PE-related events and basic references are accessible from pe_resources.php3.

[CD93]: Tutorial Notes on Partial Evaluation. C. Consel and O. Danvy. In ACM Symposium on Principles of Programming Languages, pages 493-501, 1993.
[CHL+98]: C. Consel, L. Hornof, J. Lawall, R. Marlet, G. Muller, J. Noyé, S. Thibault, and N. Volanschi. Tempo: Specializing systems applications and beyond. ACM Computing Surveys, Symposium on Partial Evaluation, 1998. To appear.
[CHN+96]: C. Consel, L. Hornof, F. Noël, J. Noyé, and E.N. Volanschi. A uniform approach for compile-time and run-time specialization. In O. Danvy, R. Glück, and P. Thiemann, editors, Partial Evaluation, International Seminar, Dagstuhl Castle, number 1110 in Lecture Notes in Computer Science, pages 54-72, February 1996.
[CN96]: C. Consel and F. Noël. A general approach for run-time specialization and its application to C. In Conference Record of the 23rd Annual ACM SIGPLAN-SIGACT Symposium on Principles Of Programming Languages, pages 145-156, St. Petersburg Beach, FL, USA, January 1996. ACM Press.
[DRT96]: Partial Evaluation. O. Danvy, R. Glück and P. Thiemann (Eds.). Lecture Notes in Computer Science, Vol. 1110.
[JGS93]: Partial evaluation and automatic program generation. N.D. Jones, C. Gomard and P. Sestoft. Prentice Hall international series in computer science, 1993.
[NHCL97]: F. Noël, L. Hornof, C. Consel, and J. Lawall. Automatic, template-based run-time specialization : Implementation and experimental study. In International Conference on Computer Languages, Chicago, IL, May 1998. IEEE Computer Society Press. Also available as IRISA report PI-1065.

Something missing? Send suggestions for additions and improvement!

Last modified: 2003-09-25. - Jocelyn.Frechot@labri.fr - http://compose.labri.fr

from: http://compose.labri.fr/documentation/pe/pe_overview.php3

weidagang2046 2006-12-15 14:40 发表评论

weidagang2046 — Fri, 01 Dec 2006 04:08:00 GMT

生物学上�Q�小生境是指特定环境下的一�U�组�l�结构。在自然界中�Q�往往特征�Q��Ş状相似的物种相聚在一��P��q�在同类中交配繁衍后代。在SGA 中，交配完全是随机的�Q�在�q�化的后期，大量的个体集中于某一极值点上，在用遗传��法求解多峰值问题时�Q�经常只能找��C��别的几个最优��|��甚至往往得到是局部最优解。利用小生境我们可以扑ֈ�全部最优解�?br />��生境技术就是将每一代个体划分�ؓ(f��)若干�c�，每个�c�M��选出若干适应度较大的个体作�ؓ(f��)一个类的优�U�代表�l�成一个群�Q�再在种��中�Q�以�?qi��ng)不同种��中之间�Q�杂交，变异产生��C��代个体群。同旉��用预选择机制和排挤机制或分��n机制完成��d��。基于这�U�小生境的遗传算法（Niched Genetic Algorithms�Q�NGA�Q�，可以更好的保持解的多��h��，同时��h��很高的全局��M��能力和收敛速度�Q�特别适合于复杂多峰函数的优化问题�?br />模拟��生境技术主要徏立在常规选择操作的改�q�之上。Cavichio �?970�q�提��Z��(ji��n)��Z��预选择机制的选择�{�略�Q�其基本做法是：(x��)当新产生的子代个体的适应度超�q�其父代个体的适应度时�Q�所产生的子代才能代替其父代而遗传到下一代群体中去，否则父代个体仍保留在下一代群体中。由于子代个体和父代个体之间�~�码�l�构的相似性，所以替换掉的只是一些编码结构相似的个体�Q�故它能够有效的�l�持��体的多��h��，�q��就��生境的�q�化环境。De Jong�?975�q�提出基于排挤机制的选择�{�略�Q�其基本思想源于在一个有限的生存环境中，各种不同的生物�ؓ(f��)�?ji��n)能够�g�l�生存，他们之间必须�怺�竞争各种有限的生存资源。因此，在算法中讄��一个排挤因子CF�Q�一般取CF=2�?�Q�，��q��体中随机选取�?/CF 个个体组成排挤成员，然后依据��C�生的的个体与排挤成员的相似性来排挤一些与预排挤成员相�c�M��的个体，个体之间的相似性可用个体编码之间的��h��距离来度量。随着排挤�q�程的进行，��体中的个体逐渐被分�c�，从而�Ş成一个个��的生成环境�Q��ƈ�l�持��体的多��h��?br />  Goldberg�{�在1987�q�提��Z��(ji��n)��Z��׃�n机制�Q�Sharing�Q�的��生境实现方法。这�U�实现方法的基本思想是：(x��)通过反映个体之间的相似程度的�׃�n函数来调节群体中各个个体的适应度，从而在�q�以后的��体�q�化�q�程中，��法能够依据�q�个调整后的新适应度来�q�行选择�q�算�Q�以�l�持��体的多��h��，创造出��生境的�q�化环境�?br />�׃�n函数�Q�Sharing Function�Q�是表示��体中两个个体之间密切关�pȝ��度的一个函敎ͼ�可记为S�Q�d �Q�其中表�C�Z��体i和j之间的关�p�R��例如，个体基因型之间的��h��距离��可以�ؓ(f��)一�U�共享函数。这里，个体之间的密切程度主要体��Cؓ(f��)个体基因型的�怼�性或个体表现型的�怼�性上。当个体之间比较�怼��Ӟ��其共享函数值就比较大；反之�Q�当个体之间不太�怼��Ӟ��其共享函数值比较小�?br />�׃�n度是某个个体在群体中�׃�n�E�度的一中度量，它定义�ؓ(f��)该个体与��体内其它各个个体之间的�׃�n函数��g��和，用S 表示�Q?br />S = �Q�i=1�Q?�Q�M�Q?br />在计��出�?ji��n)群体中各个个体的共享度之后�Q�依据下式来调整各个个体的适应度：(x��)
F �Q�X�Q?F �Q�X�Q?S �Q�i=1�Q?�Q�M�Q?br />�׃��每个个体的遗传概率是由其适应度大��来控制的，所以这�U�调整适应度的�Ҏ(gu��)��p��够限制群体中个别个体的大量增加，从而维护了(ji��n)��体的多��h��，�q��就�?ji��n)一�U�小生境的进化环境�?br />下面介绍一个基于小生境概念的遗传算法。这个算法的基本思想是：(x��)首先两两比较��体中各个个体之间的距离�Q�若�q�个距离在预先的距离L 之内的话�Q�在比较两者之间的适应度大��，�q�对其中适应��D��低的个体施加一个较强的�|�函敎ͼ�极大地降低其适应度，�q�样�Q�对于在预先指定的某一距离L之内的两个个体，其中较差的个体经处理后其适应度变得更差，他在后面的进化过�E�被淘汰的概率就极大。也��是��_(d��)��在距��L 内将只存在一个优良个体，从而既�l�护�?ji��n)群体的多样性，又��得各个个体之间保持一定的距离�Q��ƈ使得个体能够在整个约束的�I�间中分散开来，�q�样��实��C��(ji��n)一�U�小生境遗传��法�?br />�q�个��生境算法的描述如下�Q?br />��法 NicheGA �Q?�Q�设�|�进化代数计数器�Q�随机生成M个初始群体P(y��ng)�Q�t�Q�，�q�求出各个个体的适应度F �Q�i=1�Q?�Q�M�Q�。（2�Q?依据各个个体的适应度对其进行降序排列，记忆前N个个体（N[例] Shubert 函数的全局最优化计算�?br />min f(x , x )={ } { }
s.t. -10 x 10�Q�i=1�Q?�Q?br />上述函数共有760个局部最优点�Q�其中有18个是全局最优点�Q�全局最优点处的目标函数值是f �Q�x �Q?x �Q?-186.731�?br />用上�q�小生境遗传��法求解该例题时�Q�可用下式进行目标函数值到个体适应度的变换处理�Q?br />F�Q�x �Q?x �Q?
L=202�Q�二�q�制�~�码串长度，其中每个变量�?0位二�q�制�~�码来表�C�）(j��)
M=50
T=500
p =0.1
p =0.1
L=0.5(��生境之间的距离参数)
Penlty=10 �Q�罚函数�Q?br />使用上述参数�q�行�?0�ơ，试算�Q�每�ơ都可得到许多全局最优解下表为其中一�ơ运��所得到的最好的18个个体。从该表可以看出�Q�从��生境的角度来数�Q�该��法得到�?ji��n)一个较好的�l�果。上�q�算法的特点保证�?ji��n)在一个函数峰内只存在一个较优的个体�Q�这��h��一个函数峰��是一个小生境�?br />��Z��生境遗传算法的Shubert函数优化��法计算�l�果
个体标号  x x f�Q�x �Q?x �Q?br />1  5.4828  4.8581  -186.731
2  5.4830  -7.7083 -186.731
3  4.8581  5.4831 -186.731
4  4.8581  -7.0838  -186.731
5  -4.4252  -7.4983  -186.731
6  -7.0832  -7.0838  -186.731
7  5.4827  -1.4249  -186.731
8  0.8580  5.4831  -186.731
9  4.8580  -0.8009  -186.730
10  -0.8009  -7.7084  -186.730
11  -0.8009  4.8581  -186.730
12  -7.7088  -0.7999  -186.730
13  -7.7088  -7.0831  -186.730
14  -1.4256  -0.8009  -186.730
15  -0.8011  -1.4252  -186.730
16  -7.7075  5.4834  -186.730
17  -7.7088  4.8579  -186.730
18  -7.0825  -1.4249  -186.730
下面再介�l�一�U�隔��d��生境技术的遗传��法
　隔离��生境技术的基本概念�?qi��ng)进化策略依照自然界的地理隔��L��?��遗传算法的初始��体分�ؓ(f��)几个子群�?子群体之间独立进�?各个子群体的�q�化快慢�?qi��ng)规模取决于各个子群体的�q�_��适应水��^.�׃��隔离后的子群体彼此独�?界限分明,可以对各个子��体的进化过�E�灵�z�L��制。生物界�?竞争不仅存在于个体之�?�U�群作�ؓ(f��)整体同样存在着竞争,适者生存的法则在种��这一层次上同样适用.在基于隔��ȝ��生境技术中,是通过��种��的规模同种��个体��^均适应值相联系来实��C��胜劣汰、适者生存这一机制�?子群体��^均适应值高,则其��体规模��大,反之,��体规模��小.生物界在�q�化�q�程�?适应环境的物�U�能得到更多的繁�D�机�?其后代不断地增多,但这�U�增加不是无限制�?否则��׃��(x��)引�v生态环境的��p��.在遗传算法中,��体的��M��规模是一定的,��Z��(ji��n)保证��体中物�U�的多样�?��必��限制某些子��体的规�?�U�子��体中所允许的最大规模�ؓ(f��)子群体最大允许规�?maximum allowed scale),��Cؓ(f��)S .生物界中同样�?x��)出现某些物�U�因不适应环境数量逐渐减少,直至灭绝的现�?在隔��d��生境机制�?��Z��(ji��n)保持��体的多��h�?有时需要有意识��C��护某些子��体,使之不会(x��)�q�早地被淘汰,�q�保持一定的�q�化能力.子群体的�q�化能力是和子群体的规模相联�pȝ��,要保证子��体的进化能�?必须规定每一子群体生存的最��规�?�U�Cؓ(f��)子群体最��生存规�?minimum live scale),��Cؓ(f��)S .在群体进化过�E�中,如果某一子群体在规定的代数内,持箋表现最�?应该使这个子��体灭绝,代之以搜索空间的新解,�q�一最劣子��体灭绝的机�?定义为劣�U�不�z?the worst die).子群体在�q�化�q�程�?如果出现两个子群体相似或相同的现�?则去掉其中的一�?代之以搜索空间的新解,�q�种�{�略�U�Cؓ(f��)同种互斥或种内竞�?intraspecific competition).解群中出现的新的子群�?在进化的初期往往无法同已�l�得到进化的其它子群体相竞争,如果不对此施加保�?�q�些新解往往在进化的初期��p��淘汰�?�q�显然是我们所不希望的.��Z��(ji��n)解决�q�个问题,必须�Ҏ(gu��)��产生的解加以保护,�q�种保护新解的策略叫�q�弱保护(immature protection).子群体在�q�化�q�程�?如果收敛到或接近局部最优解,�?x��)出现进化停滞的现�?此时应当以某�U�概率将该子��体��L��,代之以搜索空间的新解,此种�{�略�U�Cؓ(f��)新老更�?the new superseding the old).在进化过�E�中,表现最优的个体�q�化为最优解的概率最�?应当使它充分�q�化,故新老更替策略不能用于最优子��体,�q�种做法�U�Cؓ(f��)优种保留(the best live).优种保留可以作用于最好的一个子��体,也可以作用于最好的几个子群�?
��Z��隔离��生境技术的遗传��法步骤
1)�~�码:针对具体问题,选择合适的�~�码�Ҏ(gu��)��,完成问题解空间向遗传��法解空间的转化.
2)产生初始��体:随机产生N个初始个�?
3)初始��体隔离:��N个初始个体均分给K个子��体,每个子群体含有的个体数均为N/K.
4)计算适应�?计算��体中所有个体的适应�?�q�保存适应值最高的个体.
5)��定子群体规�?子群体的规模同子��体的��^均适应值相�?子群体的�q�_��适应��D��?其在下一代中拥有的个体就��多;反之,在下一代中拥有的个体就��?但数目必��L��x��大允许规模和最��保护规模的限制,即第t+1代第k个子��体的规模n (t+1)满��S ≤n (t+1) ≤S .
��定子群体规模的具体�Ҏ(gu��)��如下,首先�l�每个子��体都预分配S 个个�?剩下的个体根据子��体的��^均适应值利用赌轮法选择,直到�ȝ��体数量辑ֈ�N为止.子群体的�q�_��适应��g��般可��单取为f (t)= (1)
式中f (t)为t代第k个子��体的��^均适应�?f (t)为t代第k个子��体中第i个个体的适应�? n (t+1)为t代第k个子��体的规�?子群体k�W�t+1代的规模n (t+1)为：(x��)　　
n (t+1)=N . f (t)/ �Q?�Q?br />子群体规模的��定也可以根据其�q�_��适应水��^用赌轮法��定.
6)保护解除判定:对群体中施加保护的群�?�q�行保护解除判定,�Ҏ(gu��)��保护解除条件的,撤除保护.
7)劣种不活判定:对解��中没有保护而连�l�几代表现又最差的��体,予以剔除�q��生等规模的新子群�?
8)同种互斥判定:随机挑选出两个子群�?依据某种原则判定其相似程�?�Ҏ(gu��)��相似条件的两个子群�?��L��其中的一�?产生同等规模的新�?
9)新老更替判�?判定解群中是否存在已�l�进化停滞的子群�?如果�?�q�行新老更�?产生同等规模的新�?但对包含最优个体的子群体要保留(最优保留机�?.
10)重新计算适应�?�Ҏ(gu��)��产生的子��体计算适应性�?�q�施加幼�׃��护措�?
11)子群体进�?�׃��子群体的规模同其在群体中的��^均表现水�q�相联系,故子��体的规模是不断变化�?
�Ҏ(gu��)��公式(2)��定的规�?选择出子��体的繁�D�个�?利用交叉和变异算子��生下一代解��?
12)收敛性判�?如果满��收敛性条�?或已�l�进化了(ji��n)规定的代�?则结束进化过�E?否则�q�回�W?步�?br />除了(ji��n)上面的还有下面几�U�常用的的小生境��法�Q?br />1 ��定性拥挤算�?br />��定性拥挤（Deterministic crowding, DC�Q�算法由Mahfoud 提出。该��法属于拥挤��法范畴�Q�采用子个体与父个体直接�q�行竞争的模式，竞争的内容包括适应值和个体之间的距��R��算法的�q�程如下�Q?br />��定性拥挤算法（重复G 代）(j��)
重复下列步骤N/2�ơ：(x��)
�Q?�Q�用攑֛�的方式随机选择两个父个体p 和p �?br />�Q?�Q�对其进行杂交和变异�Q��生两个个体c 和c �?br />�Q?�Q�如果[d(p �Q�c )+d(p �Q�c )] [d(p �Q�c )+d(p �Q�c )]�Q�则
如果f�Q�c �Q?gt;f�Q�p �Q?则用c 代替p �Q�否则保留p �?br />如果f�Q�c �Q?gt;f�Q�p �Q�，则用c 替换p �Q�否则保留p �?br />如果f�Q�c �Q?gt;f�Q�p �Q�，则用c 替换p �Q�否则保留p �?br />如果f�Q�c �Q?gt;f�Q�p �Q�，则用c 替换p �Q�否则保留p �?br />其中�Q�N 是种��规模，的d�Q�i�Q�j�Q�是个体i 和个体j 之间的距��R�?br />2 限制锦标赛算�?br />限制锦标赛选择�Q�Restricted tournament selection RTS�Q�算法由Harik 提出。该��法属于拥挤��法范畴�Q�采用了(ji��n)个体与种��中其它个体�q�行竞争的模式，竞争的内容包括适应值和个体之间的距��R��该��法的过�E�如下：(x��)
限制锦标赛算法（重复G代）(j��)
重复下列步骤N/2�ơ：(x��)
�Q?�Q�  用有放回的方式随机选择两个父个体p 和p �?br />�Q?�Q�  对其进行杂夹和变异�Q��生两个子个体c 和才c �?br />�Q?�Q�  分别�ؓ(f��)c 和c从当前的�U�群中随机的选择出w个个体�?br />�Q?�Q?不失一般性，设d 和d 分别是w个个体的中与c 和c 距离最�q�的两个个体�?br />�Q?�Q?如果f�Q�c �Q?gt;f�Q�d �Q�，则用c 替d 换，否则保留d �?br />如果f�Q�c �Q?gt;f�Q�d �Q�，则用c 替换d �Q�否则保留d �?br />3多小生境拥挤��法
多小生境拥挤��法�Q�Multi-niche crowding�Q�MNC�Q�由Cedeno提出。该��法属拥挤算法的范畴�Q�采用种��中的若�q�个体相互竞争的模式�Q�竞争的内容包括适应值和个体之间的距��R��竞争选择出的老个体被��C��体��生的子个体替换。算法的�q�程如下�Q?br />多小生境拥挤��法�Q�重复G 代）(j��)
重复下列步骤N/2�ơ：(x��)
�Q?�Q�  用有放回的方式随机选父个体p �?br />�Q?�Q�  从�U�群中随机选择C 个体作�ؓ(f��)p 的交配候选集�Q�从中选出与p 最接近的个体p �?br />�Q?�Q�  对p 和p �q�行杂交和变异，产生两个个体c 和c �?br />�Q?�Q�  分别�ؓ(f��)c 和c 从中当前�U�群中各随机选择出C ��个体，每群个体包含w个个体�?br />�Q?�Q�  每一��个体都选出一个与对应字个体距��L��q�的个体。这样就为每个个体��生了(ji��n)C 个替换候选个体�?br />�Q?�Q�  不�׃��般性，设d 和d 是两个替换候选集中适应值最低的个体�?br />�Q?�Q�  用c 替换d �Q�用c 替换d �?br />Cedeno �q�给��Z��(ji��n)C �Q�w和C 的最优参数倹{��C 应该在区间[2�Q?]内，C 和w臛_��应该两倍于用户希望扑ֈ�的全局��C��数。该��法的步�?提出�?ji��n)一中基于试探性的�Ҏ(gu��)��的限制交配策略�?br />4 标准适应值共享算�?br />标准适应值共享算法（Standard fitness sharing SH�Q�由Goldberg 和Richardson 提出。该��法属于适应值共享算法范��_(d��)��事先需要给��I�间中小生境的半径，�q�假设解�I�间中峰半径均相同。算法的�q�程如下�Q?br />标准的适应值共享算法（重复G 代）(j��)
�Q?�Q�  计��种��中个体之间的共享函数值sh�Q�d �Q?br />sh�Q�d �Q?
其中�Q?是事先给出的峰半径，d 是个体i和个体j之间的距��，是控制共享函数�Ş状的参数�Q�一般取 =1�Q�线形共享函敎ͼ�(j��)。两个个体之间共享函数��D��大，则两个个体越接近�?br />�Q?�Q�  计��种��中个体的小生境数m
m =
其中�Q�N 是种��规模。个体的��生境数��大�Q�则该个体周围绕着��多其它个体�?br />�Q?�Q�  计��种��中个体�׃�n后的适应值f
f =f / m
�Q?�Q�  用个体�׃�n后的适应��D��行选择�Q�杂交和变异出新的个体，生成��C��代种��?br />Deb和Goldberg 在假设解�I�间中峰均匀分布�q�且峰半径相同的前提下，提出计算峰半径的计算公式。此外它们还提供�?ji��n)一�U�基于峰半径的限制交配策略，从而保证所有的杂交均在同一物种�q�行�Q�确保了(ji��n)后代和父母的均属于同一��生境。标准适应值共享算法计��距��ȝ��旉��复杂度�ؓ(f��)O�Q�N �Q��?br />5 清除��法
清除�Q�Clearing�Q�算法由Petrowski 提出。该��法属于适应值共性算法范��_(d��)��事先需要给��I�间的小生境半径 �Q�重要参敎ͼ�(j��)和小生境的容�?�Q�次要参敎ͼ�(j��)�Q��ƈ假设解空间中峰值半径均相同。算法的�q�程如下�Q?br />清除��法�Q�G�Q?br />�Q?�Q�  按照适应值对个体�q�行降序排列�?br />�Q?�Q�  将�W�一个体指定为第一个小生境中心(j��)�?br />�Q?�Q�  从�W�二个个体开始顺序执行下列步骤到最后一个个体：(x��)
�Q?.1�Q�如果当前个体到所有已指定��生境中�?j��)的距离均大于，则该个体被指定��?f��)一个新的小生境中心(j��)。该个成��Z��胜者�?br />�Q?.2�Q�如果当前个体到某个已指定的��生境中�?j��)的距离��于�Q��ƈ且该��生境个数小于，则该个体加入到该��生境中去，该小生境的个体��L��增加1。该个体成�ؓ(f��)优胜者�?br />�Q?.3�Q�其它个体均为失败者�?br />�Q?.4�Q�维持所有优胜者的适应度不变，��所有失败者的适应值置�?�?br />�Q?�Q�用个体修改后的适应��D��行选择�Q�杂交和变异出新个体�Q�生成新一代种��?br />清除��法计算距离的时间复杂度为O�Q�kN�Q�，其中k是该��法�l�持的小生境数量。如果将优胜者的��生境数看�ؓ(f��)一�Q�而将��p�|者的��生境看作无�I�大�Q�则清除��法也可看作标准适应值共享算法的改进�?br />6 �l�合适应值共享的自适应k均��D��cȝ��?br />�l�合适应值共享的自适应��法k均��D��cȝ��法（Adaptive k-mean clustering with fitness sharing�Q�算法由Yin 和German提出。该��法属于适应值共性算法范��_(d��)��事先需要给��I�间中小生境中新建的最��距��?和小生境中的个体到该��生境中�?j��)之间的最大距��?。解�I�间中峰半径可能不相同。算法的�q�程如下�Q�结合适应值共享的自适应k均值均�cȝ��法（重复G代）(j��)
�Q?�Q�  按照适应值对个体�q�行降序排列�?br />�Q?�Q��? 产生在[1�Q�N]之间的随机整数k�Q�初始小生境个数�Q��?br />�Q?�Q�  将前k个个体分别放入不同的��生境中�q�成为小生境中心(j��)。确保所�?��生境中�?j��)间距离大�?�Q�如果不能满��一条�g�Q�则合�ƈ��生境，新的��生境中�?j��)就是该��生境中所有个体的中心(j��)�?br />�Q?�Q�  对于其它N-k个个体中的每一个，计算其与当前所有想生境中心(j��)之间的距��R��如果距��d��?�Q�则生成新的��生境，该个体成为新��生境的中心(j��)。否则将该个体安排到距离最�q�的��生境中厅R��据需要确保所有小生境中心(j��)间的距离均大�?�Q�如果不能满��一条�g�Q�则需要合�q�小生境�?br />�Q?�Q�  所有个体均被安�|�完毕后�Q�固定小生境的中�?j��)，��所有个体按照最��?
距离原则安排到最�q�的��生境中厅R�?br />�Q?�Q�  计��计��种��个体的��生境数m
m =n - n �Q�d /2 �Q?若x C
其中�Q�n 是第c个小生境中包含个个体��L��Q�d 是个体i与它归属的小生境中心(j��)之间的距��，x 是第i个个体，C �W�c 个小生境的个体基�Q?是控制函数�Ş状的参数�Q�通常 =1�?br />�Q?�Q�  用公式计算个体�׃�n后的适应倹{�?br />�Q?�Q�  用个体�׃�n后的适应��D��行选择�Q�杂交和变异出新的个体，生成��C�� 代个体种��?br />�l�合适应值共享的自适应性k均��D��cȝ��法计��距��ȝ��旉��复杂度�ؓ(f��)O�Q�Kn�Q��?br />7 动态小生境�׃�n��法
动态小生境�׃�n��方法（Dynamic niche sharing�Q�是由Miller和Shaw 提出。该��法属于适应值共享算法范��_(d��)��事先需要给��I�间中小生境的半�?和小生境的数量k。算法的�q�程如下�Q?br />动态小生境�׃�n��法�Q�重复G代）(j��)
�Q?�Q�  按照适应值对个体�q�行降序排列�?br />�Q?�Q�  将�W�一个个体指定�ؓ(f��)�W�一个小生境中心(j��)�?br />�Q?�Q�  从�W�二个个体开始顺序执行下列步骤到最后一个个体：(x��)
�Q?.1�Q�如果当前个体与所有已指定的小生境中心(j��)之间的距��d��?�Q�而且已指定的��生境数量小于k�Q�则形成一个新的小生境�Q�该个体成�ؓ(f��)新小生境的中�?j��)�?br />�Q?.2�Q�如果当前个体与所有小生境中心(j��)之间的距��d��大于 �Q�而且已指定的��生境数量不��于k�Q�则该个体成为独立个体�?br />�Q?�Q?对于那些属于某个��生境的个体�Q�其��生境数��是它所属的��生境中个体的数量。对于那些独立个体，采用公式计算��生境数�?br />�Q?�Q?用公式计��个体共享后的适应倹{�?br />�Q?�Q?用共享后的适应��D��行选择�Q�杂交和变异出新的个体，生成��C��代种��。动态小生境�׃�n��法计算距离的时间复杂度为O�Q�Kn�Q��?br />8 自适应��生境算�?br />自适应��生境算法（Adaptive nicking�Q�由Goldberg �?Wang 提出。该��法属于适应值共享算法范��_(d��)��事先需要给��I�间中小生境的半�?和小生境的数量k。算法包含两个分别被�U�Cؓ(f��)��֮�和商家的个体��，利用�q�两个个体群的共同演化实现多��C��化的目的。顾客群�c�M��于其它适应值共享算法中的种��，而商家群则代表搜索空间中峰的集合。商家群的个体数量k略大于其它适应值共享算法中的小生境�?w��i)立功能。顾客群中的个体的适应��g��其它适应值共享算法中个体的适应值相同，而商家群中的个体的适应值是属于该商家所有顾客的适应��g��和�?br />��法需要首先在搜烦(ch��)�I�间中随机放�|�商家群的个体，其余的过�E�如下；
自适应��生境算法（重复G 代）(j��)
�Q?�Q�  将每一个顾客群中的个体都安排到最�q�的商家中去�?br />�Q?�Q�  计��所有顾客的��生境数�Q�其归属的商家所拥有的顾客数量）(j��)�?br />�Q?�Q�  用公式计算��֮��的个体�׃�n后的适应倹{�?br />�Q?�Q�  用��֮��中个体�׃�n后的适应值尽�?j��)选择�Q�杂交和变异出新的个体，生成��C��代顾客群�?br />�Q?�Q�  顺序选择每一个商家群中的个体�q�对其进行变异操作以产生新的商家。如果新商家的适应值比老商家的适应高，而且与其它商家之间的距离均小于，则新商家代替老商家。否则进行另外一�ơ变异操作，直到产生可以替换的新商家或变异操作的�ơ数��过指定的最大变异�ؓ(f��)止�?br />自适应��生境算法计��距��ȝ��旉��的复杂度为O(Kn).

from: http://qbwh.com/viewthread_123913.html

weidagang2046 2006-12-01 12:08 发表评论

weidagang2046 — Thu, 30 Nov 2006 13:05:00 GMT

保罗格雷厄姆

�U�翰麦卡锡于1960�q�发表了(ji��n)一��非凡的论文,他在�q�篇论文中对�~�程的�A(ch��)献有如欧几里德对几何的�A(ch��)�?¹ 他向我们展示�?在只�l�定几个��单的操作�W�和一个表�C�函数的记号的基��? 如何构造出一个完整的�~�程语言. 麦卡锡称�q�种语言为Lisp, 意�ؓ(f��)List Processing, 因�ؓ(f��)他的主要思想之一是用一�U�简单的数据�l�构�?list)来代表代码和数据.

值得注意的是,麦卡锡所作的发现,不仅是计��机史上划时代的大事, 而且是一�U�在我们�q�个时代�~�程��来��趋向的模式.我认为目前�ؓ(f��)止只有两�U�真正干净利落, 始终如一的编�E�模�?C语言模式和Lisp语言模式.此二者就象两座高�? 在它们中间是��如沼泽的低�?随着计算机变得越来越强大,新开发的语言一直在坚定地趋向于Lisp模式. 二十�q�来,开发新�~�程语言的一个流行的�U�决�?取C语言的计��模�?逐渐地往上加Lisp模式的特�?例如�q�行时类型和无用单元攉��.

在这��文章中我尽可能用最��单的术语来解释约��麦卡锡所做的发现. 关键是我们不仅要学习(f��n)某个人四十年前得出的有趣理论�l�果, 而且展示�~�程语言的发展方�? Lisp的不同寻�怹��?-也就是它优质的定�?-是它能够自己来编写自�? ��Z��(ji��n)理解�U�翰麦卡锡所表述的这个特�?我们��追溯他的步�?�q�将他的数学标记转换成能够运行的Common Lisp代码.

七个原始操作�W?/a>

开始我们先定义表达�?/em>.表达式或是一�?em>原子(atom),它是一个字母序�?�?foo),或是一个由零个或多个表辑ּ��l�成�?em>�?/em>(list), 表达式之间用�I�格分开, 攑օ�一�Ҏ(gu��)��号中. 以下是一些表辑ּ�:

foo
()
(foo)
(foo bar)
(a b (c) d)

最后一个表辑ּ�是由四个元素�l�成的表, �W�三个元素本�w�是�׃��个元素组成的�?

在算术中表达�?1 + 1 得出�?. 正确的Lisp表达式也有�? 如果表达�?i>e得出�?i>v,我们�?i>e�q�回v. 下一步我们将定义几种表达式以�?qi��ng)它们的�q�回�?

如果一个表辑ּ�是表,我们�U�第一个元素�ؓ(f��)操作�W?/em>,其余的元素�ؓ(f��)自变�?/em>.我们��定义七个原�?从公理的意义上说)操作�W? quote,atom,eq,car,cdr,cons,�?cond.

(quote x) �q�回x.��Z��(ji��n)可读性我们把(quote x)��?�?x.
> (quote a) a > 'a a > (quote (a b c)) (a b c)

(atom x)�q�回原子t如果x的值是一个原子或是空�?否则�q�回(). 在Lisp中我们按惯例用原子t表示�? 而用�I��表示�?
> (atom 'a) t > (atom '(a b c)) () > (atom '()) t
既然有了(ji��n)一个自变量需要求值的操作�W? 我们可以看一下quote的作�? 通过引用(quote)一个表,我们避免它被求�? 一个未被引用的表作��变量传给�?atom�q�样的操作符��被视�ؓ(f��)代码:
> (atom (atom 'a)) t
反之一个被引用的表仅被视�ؓ(f��)�? 在此例中��是有两个元素的�?
> (atom '(atom 'a)) ()
�q�与我们在英语中使用引号的方式一�? Cambridge(剑桥)是一个位于麻萨诸塞州�?0000人口的城�? 而``Cambridge''是一个由9个字母组成的单词.
引用看上��d��能有点奇怪因为极��有其它语言有类似的概念. 它和Lisp最与众不同的特征紧密联�p?代码和数据由相同的数据结构构�? 而我们用quote操作�W�来区分它们.

(eq xy)�q�回t如果x�?i>y的值是同一个原子或都是�I��, 否则�q�回().
> (eq 'a 'a) t > (eq 'a 'b) () > (eq '() '()) t

(car x)期望x的值是一个表�q�且�q�回x的第一个元�?
> (car '(a b c)) a

(cdr x)期望x的值是一个表�q�且�q�回x的第一个元素之后的所有元�?
> (cdr '(a b c)) (b c)

(cons xy)期望y的值是一个表�q�且�q�回一个新�?它的�W�一个元素是x的�? 后面跟着y的值的各个元素.
> (cons 'a '(b c)) (a b c) > (cons 'a (cons 'b (cons 'c '()))) (a b c) > (car (cons 'a '(b c))) a > (cdr (cons 'a '(b c))) (b c)

(cond (...) ...(...)) 的求��D��则如�? p表达式依�ơ求值直到有一个返回t. 如果能找到这��L(f��ng)��p表达�?相应�?i>e表达式的��g��为整个cond表达式的�q�回�?
> (cond ((eq 'a 'b) 'first) ((atom 'a) 'second)) second
当表辑ּ�以七个原始操作符中的五个开头时,它的自变量��L��要求值的.² 我们�U�这�?的操作符�?em>函数.

函数的表�C?/a>

接着我们定义一个记��h��描述函数.函数表示�?lambda (...) e),其中 ...是原�?叫做参数),e是表辑ּ�. 如果表达式的�W�一个元素�Ş式如�?
((lambda (...) e) ...)

则称�?em>函数调用.它的��D��如�?每一个表辑ּ�先求�?然后e再求�?�?i>e的求��D��E�中,每个出现�?i>e中的的值是相应�?img height="28" alt="$a_{i}$" src="http://daiyuwen.freeshell.org/gb/rol/img7.png" width="18" align="middle" border="0" />在最�q�一�ơ的函数调用中的�?

> ((lambda (x) (cons x '(b))) 'a)
(a b)
> ((lambda (x y) (cons x (cdr y)))
   'z
   '(a b c))
(z b c)

如果一个表辑ּ�的第一个元�?i>f是原子且f不是原始操作�W?

(f ...)

�q�且f的值是一个函�?lambda (...)),则以上表辑ּ�的值就�?

((lambda (...) e) ...)

的�? 换句话说,参数在表辑ּ�中不但可以作��变量也可以作为操作符使用:

> ((lambda (f) (f '(b c)))
   '(lambda (x) (cons 'a x)))
(a b c)

有另外一个函数记号��得函数能提及(qi��ng)它本�w?�q�样我们��p��方便地定义递归函数.³ 记号

(label f (lambda (...) e))

表示一个象(lambda (...) e)那样的函�?加上�q�样的特�? ��M��出现�?i>e中的f��求��gؓ(f��)此label表达�? ��好�?i>f是此函数的参�?

假设我们要定义函�?subst x y z), 它取表达�?i>x,原子y和表z做参�?�q�回一个象z那样的表, 不过z中出现的y(在�Q何嵌套层�ơ上)�?i>x代替.

> (subst 'm 'b '(a b (a b c) d))
(a m (a m c) d)

我们可以�q�样表示此函�?

(label subst (lambda (x y z)
               (cond ((atom z)
                      (cond ((eq z y) x)
                            ('t z)))
                     ('t (cons (subst x y (car z))
                               (subst x y (cdr z)))))))

我们��?i>f=(label f (lambda (...) e))�?

(defun f (...) e)

于是

(defun subst (x y z)
  (cond ((atom z)
         (cond ((eq z y) x)
               ('t z)))
        ('t (cons (subst x y (car z))
                  (subst x y (cdr z))))))

偶然地我们在�q�儿看到如何写cond表达式的�~�省子句. �W�一个元素是't的子句��L��?x��)成功�? 于是

(cond (x y) ('t z))

�{�同于我们在某些语言中写�?

if x then y else z

一些函�?/a>

既然我们有了(ji��n)表示函数的方�?我们�Ҏ(gu��)��七个原始操作�W�来定义一些新的函�? ��Z��(ji��n)方便我们引进一些常见模式的��记法. 我们用cxr,其中x是a或d的序�?来简记相应的car和cdr的组�? 比如(cadr e)�?car (cdr e))的简�?它返�?i>e的第二个元素.

> (cadr '((a b) (c d) e))
(c d)
> (caddr '((a b) (c d) e))
e
> (cdar '((a b) (c d) e))
(b)

我们�q�用(list ...)表示(cons ...(cons '()) ...).

> (cons 'a (cons 'b (cons 'c '())))
(a b c)
> (list 'a 'b 'c)
(a b c)

现在我们定义一些新函数. 我在函数名后面加�?ji��n)�?以区别函数和定义它们的原始函�?也避免与现存的common Lisp的函数冲�H?

(null. x)��试它的自变量是否是�I��.

(defun null. (x)
  (eq x '()))

> (null. 'a)
()
> (null. '())
t

(and. x y)�q�回t如果它的两个自变量都是t, 否则�q�回().

(defun and. (x y)
  (cond (x (cond (y 't) ('t '())))
        ('t '())))

> (and. (atom 'a) (eq 'a 'a))
t
> (and. (atom 'a) (eq 'a 'b))
()

(not. x)�q�回t如果它的自变量返�?),�q�回()如果它的自变量返回t.

(defun not. (x)
  (cond (x '())
        ('t 't)))

> (not. (eq 'a 'a))
()
> (not. (eq 'a 'b))
t

(append. x y)取两个表�q�返回它们的�q�结.

(defun append. (x y)
   (cond ((null. x) y)
         ('t (cons (car x) (append. (cdr x) y)))))

> (append. '(a b) '(c d))
(a b c d)
> (append. '() '(c d))
(c d)

(pair. x y)取两个相同长度的�?�q�回一个由双元素表构成的表,双元素表是相应位�|�的x,y的元素对.

(defun pair. (x y)
  (cond ((and. (null. x) (null. y)) '())
        ((and. (not. (atom x)) (not. (atom y)))
         (cons (list (car x) (car y))
               (pair. (cdr) (cdr y))))))

> (pair. '(x y z) '(a b c))
((x a) (y b) (z c))

(assoc. x y)取原�?i>x和�Ş如pair.函数所�q�回的表y,�q�回y中第一个符合如下条件的表的�W�二个元�?它的�W�一个元素是x.
```
(defun assoc. (x y)
  (cond ((eq (caar y) x) (cadar y))
        ('t (assoc. x (cdr y)))))

> (assoc. 'x '((x a) (y b)))
a
> (assoc. 'x '((x new) (x a) (y b)))
new
```

一个惊�?/a>

因此我们能够定义函数来连接表,替换表达式等�{?也许��是一个优��的表示�? 那下一步呢? 现在惊喜来了(ji��n). 我们可以写一个函��C��为我们语�a�的解释器:此函数取��L��Lisp表达式作自变量�ƈ�q�回它的�? 如下所�C?

(defun eval. (e a)
  (cond 
    ((atom e) (assoc. e a))
    ((atom (car e))
     (cond 
       ((eq (car e) 'quote) (cadr e))
       ((eq (car e) 'atom)  (atom   (eval. (cadr e) a)))
       ((eq (car e) 'eq)    (eq     (eval. (cadr e) a)
                                    (eval. (caddr e) a)))
       ((eq (car e) 'car)   (car    (eval. (cadr e) a)))
       ((eq (car e) 'cdr)   (cdr    (eval. (cadr e) a)))
       ((eq (car e) 'cons)  (cons   (eval. (cadr e) a)
                                    (eval. (caddr e) a)))
       ((eq (car e) 'cond)  (evcon. (cdr e) a))
       ('t (eval. (cons (assoc. (car e) a)
                        (cdr e))
                  a))))
    ((eq (caar e) 'label)
     (eval. (cons (caddar e) (cdr e))
            (cons (list (cadar e) (car e)) a)))
    ((eq (caar e) 'lambda)
     (eval. (caddar e)
            (append. (pair. (cadar e) (evlis. (cdr  e) a))
                     a)))))

(defun evcon. (c a)
  (cond ((eval. (caar c) a)
         (eval. (cadar c) a))
        ('t (evcon. (cdr c) a))))

(defun evlis. (m a)
  (cond ((null. m) '())
        ('t (cons (eval.  (car m) a)
                  (evlis. (cdr m) a)))))

eval.的定义比我们以前看到的都要长. 让我们考虑它的每一部分是如何工作的.

eval.有两个自变量: e是要求值的表达�? a是由一些赋�l�原子的值构成的�?�q�些值有点象函数调用中的参数. �q�个形如pair.的返回值的表叫�?em>环境. 正是��Z��(ji��n)构造和搜烦(ch��)�q�种表我们才写了(ji��n)pair.和assoc..

eval.的骨架是一个有四个子句的cond表达�? 如何对表辑ּ�求值取决于它的�c�d��. �W�一个子句处理原�? 如果e是原�? 我们在环境中��L��它的�?

> (eval. 'x '((x a) (y b)))
a

�W�二个子句是另一个cond, 它处理�Ş�?a ...)的表辑ּ�, 其中a是原�? �q�包括所有的原始操作�W? 每个对应一条子�?

> (eval. '(eq 'a 'a) '())
t
> (eval. '(cons x '(b c))
         '((x a) (y b)))
(a b c)

�q�几个子�?除了(ji��n)quote)都调用eval.来寻找自变量的�?

最后两个子句更复杂�? ��Z��(ji��n)求cond表达式的值我们调用了(ji��n)一个叫 evcon.的辅助函�? 它递归地对cond子句�q�行求�?��L��W�一个元素返回t的子�? 如果扑ֈ��?ji��n)这��L(f��ng)��子句, 它返回此子句的第二个元素.

> (eval. '(cond ((atom x) 'atom)
                ('t 'list))
         '((x '(a b))))
list

�W�二个子句的最后部分处理函数调�? 它把原子替换为它的�?应该是lambda 或label表达�?然后�Ҏ(gu��)��得结果表辑ּ�求�? 于是

(eval. '(f '(b c))
       '((f (lambda (x) (cons 'a x)))))

变�ؓ(f��)

(eval. '((lambda (x) (cons 'a x)) '(b c))
       '((f (lambda (x) (cons 'a x)))))

它返�?a b c).

eval.的最后cond两个子句处理�W�一个元素是lambda或label的函数调�?��Z��(ji��n)对label 表达式求�? 先把函数名和函数本��n压入环境, 然后调用eval.对一个内部有 lambda的表辑ּ�求�? �?

(eval. '((label firstatom (lambda (x)
                            (cond ((atom x) x)
                                  ('t (firstatom (car x))))))
         y)
       '((y ((a b) (c d)))))

变�ؓ(f��)

(eval. '((lambda (x)
           (cond ((atom x) x)
                 ('t (firstatom (car x)))))
         y)
        '((firstatom
           (label firstatom (lambda (x)
                            (cond ((atom x) x)
                                  ('t (firstatom (car x)))))))
          (y ((a b) (c d)))))

最�l�返回a.

最�?对�Ş�?(lambda (...) e) ...)的表辑ּ�求�?先调用evlis.来求得自变量(...)对应的�?...),�?)...()��d��到环境里, 然后�?i>e求�? 于是

(eval. '((lambda (x y) (cons x (cdr y)))
         'a
         '(b c d))
       '())

变�ؓ(f��)

(eval. '(cons x (cdr y))
       '((x a) (y (b c d))))

最�l�返�?a c d).

后果

既然理解�?ji��n)eval是如何工作的, 让我们回�q�头考虑一下这意味着什�? 我们在这儿得��C��(ji��n)一个非�怼��的计算模型. 仅用quote,atom,eq,car,cdr,cons,和cond, 我们定义�?ji��n)函数eval.,它事实上实现�?ji��n)我们的语言,用它可以定义��M��我们惌��的额外的函数.

当然早已有了(ji��n)各种计算模型--最著名的是囄��? 但是囄��机程序难以读�? 如果你要一�U�描�q�算法的语言, 你可能需要更抽象�? 而这��是�U�翰麦卡锡定�?Lisp的目标之一.

�U�翰麦卡锡于1960�q�定义的语言�q�缺不少东西. 它没有副作用, 没有�q�箋执行 (它得和副作用在一��h��有用), 没有实际可用的数,⁴ 没有动态可视域. 但这些限制可以��o(h��)人惊讶地用极��的额外代码来补�? Steele和Sussman在一��叫做``解释器的艺术''的著名论文中描述�?ji��n)如何做到这�?⁵

如果你理解了(ji��n)�U�翰麦卡锡的eval, 那你��׃��仅仅是理解了(ji��n)�E�序语言历史中的一个阶�D? �q�些思想至今仍是Lisp的语义核�? 所以从某种意义�? 学习(f��n)�U�翰麦卡锡的原著向我们展�C�Z��(ji��n)Lisp�I�竟是什�? 与其说Lisp是麦卡锡的设�?不如说是他的发现. 它不是生来就是一门用于�h工智�? 快速原型开发或同等层次��d��的语�a�. 它是你试囑օ�理化计算的结�?之一).

随着旉��的推�U? 中��语言, 卌��中间层程序员使用的语�a�, 正一致地向Lisp靠近. 因此通过理解eval你正在明白将来的��L��计算模式�?x��)是什么样.

注释

把约��麦卡锡的记��L(f��ng)��译�ؓ(f��)代码的过�E�中我尽可能地少做改�? 我有�q�让代码更容易阅�ȝ��念头, 但是我还是想保持原汁原味.

在约��麦卡锡的论文中,假用f来表�C? 而不是空�? 我用�I��表示假以使例子能在Common Lisp中运�? (fixme)

我略�q�了(ji��n)构造dotted pairs, 因�ؓ(f��)你不需要它来理解eval. 我也没有提apply, 虽然是apply(它的早期形式, 主要作用是引用自变量), 被约��麦卡锡�?960�q�称为普遍函�? eval只是不过是被apply调用的子�E�序来完成所有的工作.

我定义了(ji��n)list和cxr�{�作为简记法因�ؓ(f��)麦卡锡就是这么做�? 实际�?cxr�{�可以被定义为普通的函数. List也可以这�? 如果我们修改eval, �q�很�Ҏ(gu��)��做到, 让函数可以接受�Q意数目的自变�?

麦卡锡的论文中只有五个原始操作符. 他��用了(ji��n)cond和quote,但可能把它们作�ؓ(f��)他的元语�a�的一部分. 同样他也没有定义逻辑操作�W�and和not, �q�不是个问题, 因�ؓ(f��)它们可以被定义成合适的函数.

在eval.的定义中我们调用�?ji��n)其它函数如pair.和assoc.,但�Q何我们用原始操作�W�定义的函数调用都可以用eval.来代�? �?

(assoc. (car e) a)

能写�?

(eval. '((label assoc.
                (lambda (x y)
                  (cond ((eq (caar y) x) (cadar y))
                        ('t (assoc. x (cdr y))))))
         (car e)
         a)
        (cons (list 'e e) (cons (list 'a a) a)))

麦卡锡的eval有一个错�? �W?6行是(相当�?(evlis. (cdr e) a)而不�?cdr e), �q��得自变量在一个有名函数的调用中被求��g��? �q�显�C�当论文发表的时�? eval的这�U�描�q�还没有用IBM 704机器语言实现. 它还证明�?ji��n)如果不去运行程�? 要保证不��多短的�E�序的正��性是多么困难.

我还在麦卡锡的论文中��到一个问�? 在定义了(ji��n)eval之后, 他��l�给��Z��(ji��n)一些更高��的函�?-接受其它函数作�ؓ(f��)自变量的函数. 他定义了(ji��n)maplist:

(label maplist
       (lambda (x f)
         (cond ((null x) '())
               ('t (cons (f x) (maplist (cdr x) f))))))

然后用它写了(ji��n)一个做微分的简单函数diff. 但是diff传给maplist一个用x做参数的函数, 对它的引用被maplist中的参数x所捕获.⁶

�q�是关于动态可视域危险性的雄辩证据, 即��是最早的更高�U�函数的例子也因为它而出�? 可能麦卡锡在1960�q�还没有充分意识到动态可视域的含�? 动态可视域令�h惊异地在Lisp实现中存在了(ji��n)相当长的旉��--直到Sussman和Steele�?1975�q�开发了(ji��n)Scheme. 词法可视域没使eval的定义复杂多��? 却�ɾ~�译器更隑ֆ��?

About this document ...

Lisp之根�?/strong>
This document was generated using the LaTeX2HTML translator Version 2K.1beta (1.48)
Copyright © 1993, 1994, 1995, 1996, Nikos Drakos, Computer Based Learning Unit, University of Leeds.
Copyright © 1997, 1998, 1999, Ross Moore, Mathematics Department, Macquarie University, Sydney.
The command line arguments were:
latex2html-split=0 roots_of_lisp.tex
The translation was initiated by Dai Yuwen on 2003-10-24
Footnotes
... �Ƨ几里�d对几何的贡献.¹
``Recursive Functions of Symbolic Expressions and Their Computation by Machine, Part1.'' Communication of the ACM 3:4, April 1960, pp. 184-195.
...当表辑ּ�以七个原始操作符中的五个开头时,它的自变量��L��要求值的.²
以另外两个操作符quote和cond开头的表达式以不同的方式求�? �?quote表达式求值时, 它的自变量不被求�?而是作�ؓ(f��)整个表达式的��D��? �?一个正��的cond表达式中, 只有L形�\径上的子表达式会(x��)被求�?
... �?³
逻辑上我们不需要�ؓ(f��)�?ji��n)这定义一个新的记�? 在现有的记号中用一个叫做Y�l�合器的函数上的函数, 我们可以定义递归函数. 可能麦卡锡在�?�q�篇论文的时候还不知道Y�l�合�? 无论如何, label可读性更�?
... 没有实际可用的数,⁴
在麦卡锡�?960 �q�的Lisp�? 做算术是可能�? 比如用一个有n个原子的表表�C�数n.
... 的艺�?'的著名论文中描述�?ji��n)如何做到这�?⁵
Guy Lewis Steele, Jr. and Gerald Jay Sussman, ``The Art of the Interpreter, or the Modularity Complex(Parts Zero,One,and Two),'' MIT AL Lab Memo 453, May 1978.
... 对它的引用被maplist中的参数x所捕获.⁶
当代的Lisp�E�序员在�q�儿�?x��)用mapcar代替maplist. �q�个例子解开�?ji��n)一个谜�? maplist��Z�� 么会(x��)在Common Lisp�? 它是最早的映射函数, mapcar是后来增加的.

from: http://daiyuwen.freeshell.org/gb/rol/roots_of_lisp.html

weidagang2046 2006-11-30 21:05 发表评论

weidagang2046 — Tue, 28 Nov 2006 01:58:00 GMT
     摘要: ��Z��(ji��n)试验一下多核CPU上排序算法的效率�Q�得比较单�Q务情况下和多��d��q�行排序��法的差距，因此选用快速排序算法来�q�行比较�? ��试环境�Q�双核CPU 2.66GHZ           单核CPU 2.4GHZ 以下是一个快速排序算法的源代码：(x��) UINT Split ...  阅读全文

weidagang2046 2006-11-28 09:58 发表评论

weidagang2046 — Tue, 28 Nov 2006 01:56:00 GMT

��法是计��机�U�学领域最重要的基石之一�Q�但却受��C��(ji��n)国内一些程序员的冷落。许多学生看��C��些公司在招聘时要求的�~�程语言五花八门��׃�生了(ji��n)一�U�误解，认�ؓ(f��)学计��机��是学各�U�编�E�语�a��Q�或者认为，学习(f��n)最新的语言、技术、标准就是最好的��\�Ҏ(gu��)��。其实大安��被这些公司误��g��(ji��n)。编�E�语�a�虽然该学�Q�但是学�?f��n)计��机��法和理论更重要�Q�因��机��法和理论更重要�Q�因��机语言和开发��^台日新月异，但万变不��d��宗的是那些算法和理论�Q�例如数据结构、算法、编译原理、计��机体系�l�构、关�p�d��数据库原理等�{�。在“开复学生网”上�Q�有位同学生动地把这些基��评��比拟为“内功”，把新的语�a�、技术、标准比拟�ؓ(f��)“外功”。整天赶旉��的�h最后只懂得招式�Q�没有功力，是不可能成�ؓ(f��)高手的�?

��法与我

当我�?980�q��{入计��机�U�学�p�L��Q�还没有多少人的专业方向是计��机�U�学。有许多其他�pȝ��人嘲�W�我们说�Q�“知道�ؓ(f��)什么只有你们系要加一个‘科�?’，而没有‘物理科学系’或‘化学科学系’吗�Q�因��Z�h家是真的�U�学�Q�不需要画蛇添��I��而你们自己心(j��)虚，生怕不‘科学’，才这��h��盖��I彰。”其实，�q�点他们��d��弄错�?ji��n)。真正学懂计��机的�h�Q�不只是“编�E�匠”）(j��)都对数学有相当的造诣�Q�既能用�U�学家的严�}思维来求证，也能用工�E�师的务实手�D�|��解决问题——而这�U�思维和手�D늚�最��x��l�就是“算法”�?/p>
记得我读博时写的Othello对弈软�g获得�?ji��n)世界冠军。当�Ӟ��得第二名的�h认�ؓ(f��)我是靠��o�q�才打赢他，不服气地问我的程序��^均每�U�能搜烦(ch��)多少步棋�Q�当他发现我的��Y件在搜烦(ch��)效率上比他快60多倍时�Q�才��d��服输。�ؓ(f��)什么在同样的机器上�Q�我可以多做60倍的工作呢？�q�是因�ؓ(f��)我用�?ji��n)一个最新的��法�Q�能够把一个指数函数�{换成四个�q�似的表�Q�只要用常数旉��可得到�q�似的答案。在�q�个例子中，是否用对��法才是能否赢得世界冠军的关键�?/p>
�q�记�?988�q�贝��?d��ng)实验室副总裁亲自来访问我的学校，目的��是��Z��(ji��n)想了(ji��n)解�ؓ(f��)什么他们的语音识别�pȝ��比我开发的慢几十倍，而且�Q�在扩大臛_��词汇�pȝ��后，速度差异更有几百倍之多。他们虽然买�?ji��n)几台超�U�计��机�Q�勉��pȝ��跑了(ji��n)��h��Q�但�q�么�늚�计算资源让他们的产品部门很反感，因�ؓ(f��)“昂贵”的技术是没有应用前景的。在与他们探讨的�q�程中，我惊讶地发现一个O(n*m)的动态规�?dynamic programming)居然被他们做成了(ji��n)O (n*n*m)。更惊讶的是�Q�他们还为此发表�?ji��n)不��文章，甚至��q��法起了(ji��n)一个很特别的名字，�q�将��法提名��C��个科学会(x��)议里�Q�希望能得到大奖。当�Ӟ��贝尔实验室的研究员当然绝��聪明，但他们全都是学数学、物理或甉|��n�Q�从未学�q�计��机�U�学或算法，才犯�?ji��n)这么基本的错误。我想那些�h以后再也不会(x��)嘲笑学计��机�U�学的�h�?ji��n)吧�Q?/p>

�|�络时代的算�?/b>

有�h也许�?x��)说�Q�“今天计��机�q�么快，��法�q�重要吗�Q�”其实永�q�不�?x��)有太快的计��机�Q�因为我们��M��(x��)惛_��新的应用。虽然在摩尔定律的作用下�Q�计��机的计��能力每�q�都在飞快增长，��h��也在不断下降。可我们不要忘记�Q�需要处理的信息量更是呈指数�U�的增长。现在每人每天都�?x��)创造出大量数据�Q�照片，视频�Q�语韻I��文本�{�等�Q�。日益先�q�的�U�录和存储手�D��我们每个人的信息量都在爆炸式的增�ѝ��互联网的信息流量和日志定w��也在飞快增长。在�U�学研究斚w��Q�随着研究手段的进步，数据量更是达��C��(ji��n)前所未有的程度。无论是三维囑�Ş、�v量数据处理、机器学�?f��n)、语韌��别，都需要极大的计算量。在�|�络时代�Q�越来越多的挑战需要靠卓越的算法来解决�?/p>
再�D另一个网�l�时代的例子。在互联�|�和手机搜烦(ch��)�Q�如果要��N��q�的咖啡店，那么搜烦(ch��)引擎该怎么处理�q�个��h��呢？最��单的办法��是把整个城�?j��ng)的咖啡馆都扑և�来，然后计算出它们的所在位�|�与你之间的距离�Q�再�q�行排序�Q�然后返回最�q�的�l�果。但该如何计��距��d��Q�图论里有不��算法可以解册��个问题�?/p>
�q�么做也许是最直观的，但绝对不是最�q�速的。如果一个城�?j��ng)只有��?f��)��C��多的咖啡馆，那么�q�么做应该没什么问题，反正计算量不大。但如果一个城�?j��ng)里有很多咖啡馆�Q�又有很多用户都需要类似的搜烦(ch��)�Q�那么服务器所承受的压力就大多�?ji��n)。在�q�种情况下，我们该怎样优化��法呢？

首先�Q�我们可以把整个城市(j��ng)的咖啡馆做一�ơ“预处理”。比如，把一个城�?j��ng)分成若�q�个“格�?grid)”，然后�Ҏ(gu��)��用户所在的位置把他攑ֈ�某一个格子里�Q�只�Ҏ(gu��)��子里的咖啡馆�q�行距离排序�?/p>
问题又来�?ji��n)，如果格子大小一��P��那么�l�大多数�l�果都可能出现在�?j��ng)中心(j��)的一个格子里�Q�而郊区的格子里只有极��的�l�果。在�q�种情况下，我们应该把市(j��ng)中心(j��)多分出几个格子。更�q�一步，格子应该是一个“树(w��i)�l�构”，最��层是一个大格——整个城�?j��ng)，然后逐层下降�Q�格子越来越��，�q�样有利于用戯��行精��搜索——如果在最底层的格子里搜烦(ch��)�l�果不多�Q�用户可以逐��上升�Q�放大搜索范围�?/p>
上述��法对咖啡馆的例子很实用�Q�但是它��h��通用性吗�Q�答案是否定的。把咖啡馆抽象一下，它是一个“点”，如果要搜索一个“面”该怎么办呢�Q�比如，用户惛_��一个水库玩�Q�而一个水库有好几个入口，那么哪一个离用户最�q�呢�Q�这个时候，上述“树(w��i)�l�构”就要改成“r-tree”，因�ؓ(f��)�?w��i)中间的每一个节炚w��是一个范��_(d��)��一个有边界的范��_(d��)��参�?http://www.cs.umd.edu/~hjs/rtrees/index.html�Q��?/p>
通过�q�个��例子，我们看到�Q�应用程序的要求千变万化�Q�很多时候需要把一个复杂的问题分解成若�q�简单的��问题，然后再选用合适的��法和数据结构�?/p>

�q�行��法�Q�Google的核�?j��)优�?/b>

上面的例子在Google里就要算是小case�?ji��n)！每天Google的网站要处理十亿个以上的搜烦(ch��)�Q�GMail要储存几千万用户�?G邮箱�Q?Google Earth要让数十万用户同时在整个地球上遨游，�q�将合适的囄��l�过互联�|�提交给每个用户。如果没有好的算法，�q�些应用都无法成为现实�?/p>
在这些的应用中，哪怕是最基本的问题都�?x��)给传统的计��带来很大的挑战。例如，每天都有十亿以上的用戯��问Google的网站，使用Google的服务，也��生很多很多的日志(Log)。因为Log每䆾每秒都在飞速增加，我们必须有聪明的办法来进行处理。我曄��在面试中问过关于如何对Log�q�行一些分析处理的问题�Q�有很多面试者的回答虽然在逻辑上正��，但是实际应用中是几乎不可行的。按照它们的��法�Q�即便用上几万台机器�Q�我们的处理速度都根不上数据产生的速度�?/p>
那么Google是如何解册��些问题的�Q?/p>
首先�Q�在�|�络时代�Q�就��有最好的��法�Q�也要能在�ƈ行计��的环境下执行。在Google的数据中�?j��)，我们使用的是��大的�ƈ行计��机。但传统的�ƈ行算法运行时�Q�效率会(x��)在增加机器数量后�q�速降低，也就是说�Q�十台机器如果有五倍的效果�Q�增加到一千台时也许就只有几十倍的效果。这�U�事半功倍的代�h(hu��n)是没有哪家公司可以负担得��L(f��ng)��。而且�Q�在许多�q�行��法中，只要一个结点犯错误�Q�所有计��都�?x��)前功尽弃�?/p>
那么Google是如何开发出既有效率又能定w��的�ƈ行计��的呢？

Google最资深的计��机�U�学家Jeff Dean认识刎ͼ�Google所需的绝大部分数据处理都可以归结��Z��个简单的�q�行��法�Q�Map and Reduce�Q?a class="contentlink" target="_blank">http://labs.google.com/papers/mapreduce.html�Q�。这个算法能够在很多�U�计��中辑ֈ�相当高的效率�Q�而且是可扩展的（也就是说�Q�一千台机器��q��不能辑ֈ�一千倍的效果�Q�至��也可以辑ֈ�几百倍的效果�Q��?Map and Reduce的另外一大特色是它可以利用大批廉��L(f��ng)��机器�l�成功能强大的server farm。最后，它的定w��性能异常��Q�就��一�?server farm宕掉一半，整个fram依然能够�q�行。正是因��个天才的认识�Q�才有了(ji��n)Map and Reduce��法。借助该算法， Google几乎能无限地增加计算量，与日新月异的互联�|�应用一同成�ѝ�?/p>

��法�q�不局限于计算机和�|�络

举一个计��机领域外的例子�Q�在高能物理研究斚w��Q�很多实验每�U�钟都能几个TB的数据量。但因�ؓ(f��)处理能力和存储能力的不��Q�科学家不得不把�l�大部分未经处理的数据丢弃掉。可大家要知道，新元素的信息很有可能��p��在我们来不及(qi��ng)处理的数据里面。同��L(f��ng)��Q�在其他��M��领域里，��法可以改变人类的生�z�R��例如�h�c�d��因的研究�Q�就可能因�ؓ(f��)��法而发明新的医疗方式。在国家安全领域�Q�有效的��法可能避免下一�?11的发生。在气象斚w��Q�算法可以更好地预测未来天灾的发生，以拯救生命�?/p>
所以，如果你把计算机的发展攑ֈ�应用和数据飞速增长的大环境下�Q�你一定会(x��)发现�Q�算法的重要性不是在日益减小�Q�而是在日益加强�?/p>
from: http://www.yuanma.org/data/2006/0824/article_1397.htm

weidagang2046 2006-11-28 09:56 发表评论

理论计算机初步：(x��)从hash函数到王��云的MD5破解

weidagang2046 — Sun, 19 Nov 2006 03:24:00 GMT

密码学是理论计算机的一个很大的方向。之前准备先写密码学概论再提在hash函数破解上做出重大�A(ch��)献的王小云教授的工作�Q�不�q�前两天王小云获得求是杰出科学家奖以�?00万奖�?/a>�Q�在媒体上又掀起了(ji��n)一轮宣传狂潮，但是有些报道极端弱智�Q�错误百出，所以我��机�U�正一下，�q�介�l�密码学的一个组成部分——hash函数�Q�以�?qi��ng)王��云在这上面的工作�?/p>
王小云的主要工作是关于hash函数的破解工作。她�?005一个密码学�?x��)议上宣布破解�?ji��n)SHA-1�Q�震惊了(ji��n)全世界。所以要介绍和理解她的工作，先看一下hash函数具体是怎么回事�?/p>
��单的��_(d��)��hash函数��是把�Q意长的输入字�W�串变化成固定长的输出字�W�串的一�U�函数。通俗得说�Q�hash函数用来生成信息的摘要。输出字�W�串的长度称为hash函数�?strong>位数�?/p>
目前应用最为广泛的hash函数�?strong>SHA-1�?strong>MD5�Q�大多是128位和更长�?/p>
hash函数在现实生�z�M��应用十分�q�泛。很多下载网站都提供下蝲文�g的MD5码校验，可以用来判别文�g是否完整。另外，比如在WordPress的数据库�Q�所有密码都是保存的MD5码，�q�样即��数据库的��理员也无法知道用户的原始密码，避免隐私泄露�Q�很多�h在不同地斚w��是用的同一个密码）(j��)�?/p>
如果两个输入串的hash函数的��g��P��则称�q�两个串是一�?strong>��撞(Collision)。既然是把�Q意长度的字符串变成固定长度的字符�Ԍ��所以，必有一个输��Z��对应无穷多个输入�Ԍ��撞是必然存在的�?/p>
一个“优良”的hash函数 f 应当满��以下三个条�g�Q?/p>

��L��y�Q�找x�Q��得f(x)=y�Q�非常困难�?

�l�定x1�Q�找x2�Q��得f(x1)=f(x2)�Q�非常困难�?

找x1�Q�x2�Q��得f(x1)=f(x2)�Q�非常困难�?

上面的“非常困�䏀�的意思是除了(ji��n)枚�D外不可能有别的更快的�Ҏ(gu��)��。比如第3条，�Ҏ(gu��)��生日定理�Q�要��x��到这��L(f��ng)��x1�Q�x2�Q�理��Z��需要大�U?^(n/2)的枚举次数�?/p>
几乎所有的hash函数的破解，都是指的破坏上面的第三条性质�Q�即扑ֈ�一个碰撞（前两条都能被破坏的hash函数也太�׃��(ji��n)点，早就被�h抛弃�?ji��n)�?j��)。在密码学上�q�有一个概忉|��理论破解�Q�指的是提出一个算法，使得可以用低于理论值得枚�D�ơ数扑ֈ��撞�?/p>
王小云的主要工作是给��Z��(ji��n)MD5�Q?a target="_blank">SHA-0的碰撞，以及(qi��ng)SHA-1的理论破解，她证明了(ji��n)160位SHA-1�Q�只需要大�U?^69�ơ计��就能找出来�Q�而理论值是2^80�ơ。她的寻找MD5��撞的方法是极端高效的。传说王��云当时在会(x��)议上把碰撞写出来�Q�结果被下面的�h验证发现不对�Q�原来她把MD5��法的一个步骤弄错了(ji��n)。但是她立马联系她的当时留在中国的学生，修正��法�Q��ƈ扑ֈ�一个新的碰撞。这一个是对的�?/p>
看到�q�里�Q�那些认��Z��国国安局应该��这些结果封存作为秘密武器甚臛_��想用�q�些成果来袭�ȝ��国之徒可以停住你们的YY�?ji��n)。这�U��Ş式上的破解，在大多数情况下没有实际性的作用。更别提MD5早就被美国�h抛弃�?ji��n)�?/p>
但是�Q�说�q�种破解一点实际意义都没有�Q�那��׃��׃��(ji��n)�q�大密码学家的智商，密码学家不会(x��)无缘无故的弄出碰撞这么一个概忉|��。下面简单的介绍一下在特定情况下，怎么利用�l�定的碰撞来做坏�?��译�?a target="_blank">Attacking Hash Functions)�Q?/p>
Caesar�l�实�?f��n)生Alice叫写�?ji��n)一��推荐信(letter)。同一天，Alice叫Caesar在推荐信上数字签名，�q�提供了(ji��n)一份推荐信的电(sh��)子板。Caesar打开文�g�Q�发现和原�g一模一栗��所以他在文件上�{�了(ji��n)名�?/p>
几个月后�Q�Caesar发现他的�U�密文�g被非法察看。这到底是怎么回事呢？

a25f7f0b 29ee0b39 68c86073 8533a4b9

事实上，Alice要求Caesar�{�֐�的文�?a target="_blank">letter已经被Alice做了(ji��n)手脚�Q�准��地��_(d��)��Alice�q�准备了(ji��n)另外一个文�?a target="_blank">order�Q�它们的MD5码完全一致。而Caesar的数字签名还依赖于MD5��法�Q�所以Alice用order文�g替换Letter文�g之后�Q�Caesar的数字签名依然有效。那��order�l�Alice提供�?ji��n)察看秘密文件的权限�?/p>
具体的实现方法可�?a target="_blank">Hash Functions and the Blind Passenger Attack。我在这里简单的解释一�?只是大致思�\�Q�具体实现方式，需要对文�g�l�构信息有所�?ji��n)�?�Q?/p>
letter文�g的内�Ҏ(gu��)��Q?/p>

if(x1==x1) show "letter" else show "order"

order文�g的内�Ҏ(gu��)��Q?/p>

if(x2==x1) show "letter" else show "order"

其中字符�?letter"�?order"代表两封信实际显�C�的内容。x1�Q�x2是一个MD5的碰撞�?/p>
上面的方法，只供参考和学术用途，实际使用所引�v的后果概不负责�?/p>
参考：(x��)

Attacking Hash Functions by Poisoned Messages "The Story of Alice and her Boss"

Hash function, wikipedia

SHA, wikipedia

Interview with Yiqun Lisa Yin concerning the attack on SHA-1

PS�Q�我跟王��云老师的接触很��，上过俩次她的讨论班而已�Q�亦感觉到王��云老师的严谨和耐心(j��)。在��d��一个Turing奖获得者的演讲上，王小云提问的时候竟口而出“I ask who”的中式��p��Q�在引�v哄笑的同�Ӟ��我也极端佩服她的勇气。也许只有这��h��能做出非常好的工作吧�?/p>
PS2: wikipedia在国内可以通过free_door��览�?

http://zhiqiang.org/blog/446.html
参阅: 王小�?/a>, weidagang2046 2006-11-19 11:24 发表评论

Similarity Flooding

weidagang2046 — Fri, 17 Nov 2006 10:25:00 GMT

��法大致思�\�Q?br />        把要匚w��的模型�{换�ؓ(f��)带标记的有向图（directed labeled graphs。由节点和弧�l�成的图�Q�允许对象用自��n的属性及(qi��ng)其和其他对象的关�p�L��定义�Q�类��g��ER图）(j��)。这些图要用来做�q�代的不动点计算�Q�计��结果将告诉我们一张图里的哪些节点和第二张囄��节点�怼��?br />        ��Z��(ji��n)计算�怼�度，我们利用�?ji��n)这样一个直觉：(x��)两个不同的节�Ҏ(gu��)��怼�的，当它们邻接元素是�怼�的。换句话��_(d��)��两个元素�怼�性的一部分传播�l�了(ji��n)它们各自的邻居，�q�种传播方式�c�M��于IP�q�播�Q�这也是SF�q�个名字的由来。我们把��法的结果叫做一个 mapping�Q�然后根据匹配目标，选择特定的过滤器来过滤出一个原始结果的子集。我们希望能够�h工对�l�果�q�行修正�Q�需要修正的成员数目��反映了(ji��n)��法的准��性�?br />
概述�Q?br />
        假设�?个schema�Q�S1和S2。我们要为S1里每一个元素在S2中找到匹配的元素�?br />      �q�程如下�Q?br />      1. G1 = SQL2Graph(S1); G2 = SQL2Graph(S2); 把schema变成图，��N��用了(ji��n)Open Information Model (OIM)规格�Q�图中node采用矩�Ş和卵形，矩�Ş是文字描�q�ͼ�卵�Ş是标识符

      2. initialMap = StringMatch(G1, G2);      用字�W�串匚w��做�ؓ(f��)初始匚w��Q�主要是比较通常的前�~�和后�~��Q�这��L(f��ng)��l�果通常是不准确�?br />
      3. product = SFJoin(G1, G2, initialMap);      用SF��法生成�l�果�?font color="#0000ff">假设两个不同的节�Ҏ(gu��)��怼�的，则它们邻接元素的�怼�度增加。经�q�一�p�d��的�P代，�q�种�怼�度会(x��)传遍整个�?br />
      4. result = SelectThreshold(product);   �l�果�{��?br />

SF��法

      图中的每条边�Q�用一个三元组表示�Q�s�Q�p�Q�o�Q�，分别�?源点�Q�边名，目的炏V�?br />

      �怼�度传播图�Q�首先定义pairwise connectivity graph(PCG) �Q?((x; y); p; (x'; y')) 属于 PCG(A;B)<==>(x; p; x') �?A and (y; p; y') �?B�?关键是p要相同，也就是边的名字一栗��?/font>式子从右向左推导�Q�就可以A、B从两个模型徏立�v它们的PCG�?/font>图中的每个节点，都是A和B中的元素构成�?元组�Q�叫做map pairs�?br />      induced propagation graph。从PCG推导而来�Q�加上了(ji��n)反向的边�Q�边上注明了(ji��n)[传播�p�L��]�Q��gؓ(f��) 1/n�Q�n为相应的边的数目�?br />      不动点计��：(x��)
            设�?x; y) > 0 代表�?ji��n)节点x �?A �?y �?B 的相似度�Q�是在整个 A X B的范围上定义的。我们把 �Q(m��o) 叫做 mapping。相似度的计��就是基于�?values的�P代计��。设 �Q(m��o)ⁱ 代表�?ji��n)�?i �ơ�P代后的结果，�Q(m��o)⁰ 是初始相似度�Q�可以用字符串相似度的办法的得出�Q�在我们的例子里�Q�没�?�Q(m��o)⁰ �Q�即�?�Q(m��o)⁰ =1�Q��?br />            每次�q�代中，�Q(m��o)-values 都会(x��)�Ҏ(gu��)��光��居paris�?�Q(m��o)-values 乘以[传播�p�L��] 来增加。例如，在第一�ơ�P�?�Q(m��o)¹(a1; b1) = �Q(m��o)⁰(a1; b1) + �Q(m��o)⁰(a; b) * 0.5 = 1.5。类似的�Q��?sup>1(a, b) = �Q(m��o)⁰(a, b) + �Q(m��o)⁰(a1; b1) * 1.0 + �Q(m��o)⁰(a2, b1) *1.0 = 3.0。接下来�Q�所�?�Q(m��o) ��D��行正规化�Q�比如除以当前�P代的 �Q(m��o)的最大��|��保证所�?�Q(m��o) 都不大于1。所以在正规化以后，�Q(m��o)¹(a; b) = 1.0, �Q(m��o)¹(a1, b1) = 1.5/3.0 = 0.5。一般情况下�Q��P代如下进行：(x��)

      上面的计��进行�P代，直到 �Q(m��o)ⁿ�?�Q(m��o)^n-1之间的差别小于一个阈��|��如果计算没有聚合�Q�我们就在�P代超�q�一定次数后停止。上�?的第三副图，��是5�ơ�P代后的结果。表3时一些计��方法，后面的实验表明，C比较好。A叫做 sparce�Q�B叫做 excepted�Q�C叫做verbose

�q��o(h��)

      �q�代出的�l�果是一�U�[多匹配]�Q�可能包含有用的匚w��子集�?br />      三个步骤�Q?br />            1。用�E�序定义的[限制条�g]�q�行�q��o(h��)�?br />            2。用双向图中的匹配上下文技术进行过�?br />            3。比较各�U�技术的有效性（满��用户需求的能力�Q?br />      限制�Q�主要有两种�Q�一个是[�c�d��]限制�Q�比如只考虑[列]的匹配（匚w��双方都是列）(j��)。第二个�?cardinality 限制�Q�即模式S1中的所有元素都要在S2中有一个映��?br />
stable marriage问题�Q�n奛_��n男配对，不存在这��L(f��ng)��两对 (x; y)�?x0; y0)�Q�其中x喜欢 y0 胜过 y�Q�而且 y0 喜欢 x 胜过 x0。具有stable marriage的匹配结果的total satisfaction可能�?x��)比不具有stable marriage的匹配结果还低！

匚w��质量的评�?br />
   基本的评估思想�Q�就是�?用户对匹配结果做的修改越��，匚w��质量��p��高（修改�l�果包括��L��错误的pair�Q�加上正��的pair�Q?br /> n是找到的匚w��敎ͼ�m是理想的匚w��敎ͼ�c是用户作��Z��正的数目�?br />
from: http://www.cnblogs.com/anf/archive/2006/08/15/477700.html

weidagang2046 2006-11-17 18:25 发表评论

Building Classification Models: ID3 and C4.5

weidagang2046 — Mon, 29 May 2006 13:45:00 GMT

Introduction
ID3 and C4.5 are algorithms introduced by Quinlan for inducing Classification Models, also called Decision Trees, from data.
We are given a set of records. Each record has the same structure, consisting of a number of attribute/value pairs. One of these attributes represents the category of the record. The problem is to determine a decision tree that on the basis of answers to questions about the non-category attributes predicts correctly the value of the category attribute. Usually the category attribute takes only the values {true, false}, or {success, failure}, or something equivalent. In any case, one of its values will mean failure.
For example, we may have the results of measurements taken by experts on some widgets. For each widget we know what is the value for each measurement and what was decided, if to pass, scrap, or repair it. That is, we have a record with as non categorical attributes the measurements, and as categorical attribute the disposition for the widget.
Here is a more detailed example. We are dealing with records reporting on weather conditions for playing golf. The categorical attribute specifies whether or not to Play. The non-categorical attributes are:
ATTRIBUTE | POSSIBLE VALUES ============+======================= outlook | sunny, overcast, rain ------------+----------------------- temperature | continuous ------------+----------------------- humidity | continuous ------------+----------------------- windy | true, false ============+=======================
and the training data is:
OUTLOOK | TEMPERATURE | HUMIDITY | WINDY | PLAY ===================================================== sunny | 85 | 85 | false | Don't Play sunny | 80 | 90 | true | Don't Play overcast| 83 | 78 | false | Play rain | 70 | 96 | false | Play rain | 68 | 80 | false | Play rain | 65 | 70 | true | Don't Play overcast| 64 | 65 | true | Play sunny | 72 | 95 | false | Don't Play sunny | 69 | 70 | false | Play rain | 75 | 80 | false | Play sunny | 75 | 70 | true | Play overcast| 72 | 90 | true | Play overcast| 81 | 75 | false | Play rain | 71 | 80 | true | Don't Play
Notice that in this example two of the attributes have continuous ranges, Temperature and Humidity. ID3 does not directly deal with such cases, though below we examine how it can be extended to do so. A decision tree is important not because it summarizes what we know, i.e. the training set, but because we hope it will classify correctly new cases. Thus when building classification models one should have both training data to build the model and test data to verify how well it actually works.
A simpler example from the stock market involving only discrete ranges has Profit as categorical attribute, with values {up, down}. Its non categorical attributes are:
ATTRIBUTE | POSSIBLE VALUES ============+======================= age | old, midlife, new ------------+----------------------- competition | no, yes ------------+----------------------- type | software, hardware ------------+----------------------- and the training data is: AGE | COMPETITION | TYPE | PROFIT ========================================= old | yes | swr | down --------+-------------+---------+-------- old | no | swr | down --------+-------------+---------+-------- old | no | hwr | down --------+-------------+---------+-------- mid | yes | swr | down --------+-------------+---------+-------- mid | yes | hwr | down --------+-------------+---------+-------- mid | no | hwr | up --------+-------------+---------+-------- mid | no | swr | up --------+-------------+---------+-------- new | yes | swr | up --------+-------------+---------+-------- new | no | hwr | up --------+-------------+---------+-------- new | no | swr | up --------+-------------+---------+--------
For a more complex example, here are files that provide records for a series of votes in Congress. The first file describes the structure of the records. The second file provides the Training Set, and the third the Test Set.
The basic ideas behind ID3 are that:
In the decision tree each node corresponds to a non-categorical attribute and each arc to a possible value of that attribute. A leaf of the tree specifies the expected value of the categorical attribute for the records described by the path from the root to that leaf. [This defines what is a Decision Tree.]
In the decision tree at each node should be associated the non-categorical attribute which is most informative among the attributes not yet considered in the path from the root. [This establishes what is a "Good" decision tree.]
Entropy is used to measure how informative is a node. [This defines what we mean by "Good". By the way, this notion was introduced by Claude Shannon in Information Theory.]
C4.5 is an extension of ID3 that accounts for unavailable values, continuous attribute value ranges, pruning of decision trees, rule derivation, and so on.
Definitions
If there are n equally probable possible messages, then the probability p of each is 1/n and the information conveyed by a message is -log(p) = log(n). [In what follows all logarithms are in base 2.] That is, if there are 16 messages, then log(16) = 4 and we need 4 bits to identify each message.
In general, if we are given a probability distribution P = (p1, p2, .., pn) then the Information conveyed by this distribution, also called the Entropy of P, is:
I(P) = -(p1*log(p1) + p2*log(p2) + .. + pn*log(pn))
For example, if P is (0.5, 0.5) then I(P) is 1, if P is (0.67, 0.33) then I(P) is 0.92, if P is (1, 0) then I(P) is 0. [Note that the more uniform is the probability distribution, the greater is its information.]
If a set T of records is partitioned into disjoint exhaustive classes C1, C2, .., Ck on the basis of the value of the categorical attribute, then the information needed to identify the class of an element of T is Info(T) = I(P), where P is the probability distribution of the partition (C1, C2, .., Ck):
P = (|C1|/|T|, |C2|/|T|, ..., |Ck|/|T|)
In our golfing example, we have Info(T) = I(9/14, 5/14) = 0.94,
and in our stock market example we have Info(T) = I(5/10,5/10) = 1.0.
If we first partition T on the basis of the value of a non-categorical attribute X into sets T1, T2, .., Tn then the information needed to identify the class of an element of T becomes the weighted average of the information needed to identify the class of an element of Ti, i.e. the weighted average of Info(Ti):
|Ti| Info(X,T) = Sum for i from 1 to n of ---- * Info(Ti) |T|
In the case of our golfing example, for the attribute Outlook we have
Info(Outlook,T) = 5/14*I(2/5,3/5) + 4/14*I(4/4,0) + 5/14*I(3/5,2/5) = 0.694
Consider the quantity Gain(X,T) defined as
Gain(X,T) = Info(T) - Info(X,T)
This represents the difference between the information needed to identify an element of T and the information needed to identify an element of T after the value of attribute X has been obtained, that is, this is the gain in information due to attribute X.
In our golfing example, for the Outlook attribute the gain is:
Gain(Outlook,T) = Info(T) - Info(Outlook,T) = 0.94 - 0.694 = 0.246.
If we instead consider the attribute Windy, we find that Info(Windy,T) is 0.892 and Gain(Windy,T) is 0.048. Thus Outlook offers a greater informational gain than Windy.
We can use this notion of gain to rank attributes and to build decision trees where at each node is located the attribute with greatest gain among the attributes not yet considered in the path from the root.
The intent of this ordering are twofold:
To create small decision trees so that records can be identified after only a few questions.
To match a hoped for minimality of the process represented by the records being considered(Occam's Razor).
The ID3 Algorithm
The ID3 algorithm is used to build a decision tree, given a set of non-categorical attributes C1, C2, .., Cn, the categorical attribute C, and a training set T of records.
function ID3 (R: a set of non-categorical attributes, C: the categorical attribute, S: a training set) returns a decision tree; begin If S is empty, return a single node with value Failure; If S consists of records all with the same value for the categorical attribute, return a single node with that value; If R is empty, then return a single node with as value the most frequent of the values of the categorical attribute that are found in records of S; [note that then there will be errors, that is, records that will be improperly classified]; Let D be the attribute with largest Gain(D,S) among attributes in R; Let {dj| j=1,2, .., m} be the values of attribute D; Let {Sj| j=1,2, .., m} be the subsets of S consisting respectively of records with value dj for attribute D; Return a tree with root labeled D and arcs labeled d1, d2, .., dm going respectively to the trees ID3(R-{D}, C, S1), ID3(R-{D}, C, S2), .., ID3(R-{D}, C, Sm); end ID3;
In the Golfing example we obtain the following decision tree:
Outlook / | \ / | \ overcast / |sunny \rain / | \ Play Humidity Windy / | | \ / | | \ <=75 / >75| true| \false / | | \ Play Don'tPlay Don'tPlay Play In the stock market case the decision tree is: Age / | \ / | \ new/ |mid \old / | \ Up Competition Down / \ / \ no/ \yes / \ Up Down
Here is the decision tree, just as produced by c4.5, for the voting example introduced earlier.
Using Gain Ratios
The notion of Gain introduced earlier tends to favor attributes that have a large number of values. For example, if we have an attribute D that has a distinct value for each record, then Info(D,T) is 0, thus Gain(D,T) is maximal. To compensate for this Quinlan suggests using the following ratio instead of Gain:
Gain(D,T) GainRatio(D,T) = ---------- SplitInfo(D,T) where SplitInfo(D,T) is the information due to the split of T on the basis of the value of the categorical attribute D. Thus SplitInfo(D,T) is I(|T1|/|T|, |T2|/|T|, .., |Tm|/|T|) where {T1, T2, .. Tm} is the partition of T induced by the value of D. In the case of our golfing example SplitInfo(Outlook,T) is -5/14*log(5/14) - 4/14*log(4/14) - 5/14*log(5/14) = 1.577 thus the GainRatio of Outlook is 0.246/1.577 = 0.156. And SplitInfo(Windy,T) is -6/14*log(6/14) - 8/14*log(8/14) = 6/14*0.1.222 + 8/14*0.807 = 0.985 thus the GainRatio of Windy is 0.048/0.985 = 0.049
You can run PAIL to see how ID3 generates the decision tree [you need to have an X-server and to allow access (xhost) from yoda.cis.temple.edu].
C4.5 Extensions
C4.5 introduces a number of extensions of the original ID3 algorithm.
In building a decision tree we can deal with training sets that have records with unknown attribute values by evaluating the gain, or the gain ratio, for an attribute by considering only the records where that attribute is defined.
In using a decision tree, we can classify records that have unknown attribute values by estimating the probability of the various possible results. In our golfing example, if we are given a new record for which the outlook is sunny and the humidity is unknown, we proceed as follows:
We move from the Outlook root node to the Humidity node following the arc labeled 'sunny'. At that point since we do not know the value of Humidity we observe that if the humidity is at most 75 there are two records where one plays, and if the humidity is over 75 there are three records where one does not play. Thus one can give as answer for the record the probabilities (0.4, 0.6) to play or not to play.
We can deal with the case of attributes with continuous ranges as follows. Say that attribute Ci has a continuous range. We examine the values for this attribute in the training set. Say they are, in increasing order, A1, A2, .., Am. Then for each value Aj, j=1,2,..m, we partition the records into those that have Ci values up to and including Aj, and those that have values greater than Aj. For each of these partitions we compute the gain, or gain ratio, and choose the partition that maximizes the gain.
In our Golfing example, for humidity, if T is the training set, we determine the information for each partition and find the best partition at 75. Then the range for this attribute becomes {<=75, >75}. Notice that this method involves a substantial number of computations.
Pruning Decision Trees and Deriving Rule Sets
The decision tree built using the training set, because of the way it was built, deals correctly with most of the records in the training set. In fact, in order to do so, it may become quite complex, with long and very uneven paths.
Pruning of the decision tree is done by replacing a whole subtree by a leaf node. The replacement takes place if a decision rule establishes that the expected error rate in the subtree is greater than in the single leaf. For example, if the simple decision tree
Color / \ red/ \blue / \ Success Failure
is obtained with one training red success record and two training blue Failures, and then in the Test set we find three red failures and one blue success, we might consider replacing this subtree by a single Failure node. After replacement we will have only two errors instead of five failures.
Winston shows how to use Fisher's exact test to determine if the category attribute is truly dependent on a non-categorical attribute. If it is not, then the non-categorical attribute need not appear in the current path of the decision tree.
Quinlan and Breiman suggest more sophisticated pruning heuristics.
It is easy to derive a rule set from a decision tree: write a rule for each path in the decision tree from the root to a leaf. In that rule the left-hand side is easily built from the label of the nodes and the labels of the arcs.
The resulting rules set can be simplified:
Let LHS be the left hand side of a rule. Let LHS' be obtained from LHS by eliminating some of its conditions. We can certainly replace LHS by LHS' in this rule if the subsets of the training set that satisfy respectively LHS and LHS' are equal.
A rule may be eliminated by using metaconditions such as "if no other rule applies".
You can run the C45 program here [you need to have an X-server and to allow access (xhost) from yoda.cis.temple.edu].
Classification Models in the Undergraduate AI Course
It is easy to find implementations of ID3. For example, a Prolog program by Shoham and a nice Pail module.
The software for C4.5 can be obtained with Quinlan's book. A wide variety of training and test data is available, some provided by Quinlan, some at specialized sites such as the University of California at Irvine.
Student projects may involve the implementation of these algorithms. More interesting is for students to collect or find a significant data set, partition it into training and test sets, determine a decision tree, simplify it, determine the corresponding rule set, and simplify the rule set.
The study of methods to evaluate the error performance of a decision tree is probably too advanced for most undergraduate courses.
References
Breiman,Friedman,Olshen,Stone: Classification and Decision Trees Wadsworth, 1984 A decision science perspective on decision trees. Quinlan,J.R.: C4.5: Programs for Machine Learning Morgan Kauffman, 1993 Quinlan is a very readable, thorough book, with actual usable programs that are available on the internet. Also available are a number of interesting data sets. Quinlan,J.R.: Simplifying decision trees International Journal of Man-Machine Studies, 27, 221-234, 1987 Winston,P.H.: Artificial Intelligence, Third Edition Addison-Wesley, 1992 Excellent introduction to ID3 and its use in building decision trees and, from them, rule sets.
ingargiola@cis.temple.edu

from: http://www.cis.temple.edu/~ingargio/cis587/readings/id3-c45.html

weidagang2046 2006-05-29 21:45 发表评论

weidagang2046 — Mon, 03 Apr 2006 02:11:00 GMT
�U�球问题�怿�大家已经很熟�(zh��n)�了(ji��n)�Q��ƈ且已�l�知道从12个球中找出坏球�ƈ判断其轻重最多只需�?�ơ称量。但如果把球数改变一下，比如�?3个球�Q�答案又是几�ơ呢�Q�本文将对这一问题�q�行“深入”分析。�ؓ(f��)�?ji��n)后面叙�q�方便，先在�q�里把一般化后的问题重复一下：(x��)
    有m�Q�m�?�Q�个球，��Cؓ(f��)q₁、q₂、…、q_m�Q�其中有且仅有一个坏球，光��量与其他的不同，��C��用无砝码的天�q��行称量，令n为称量次敎ͼ�问：(x��)能确保找到坏球�ƈ指出它与好球的轻重关�pȝ��n的最��值是多少�Q?/font>

    先来看理��Z��要多��次。每�ơ称量有左边轅R��^衡和双��d��3�U�可能的情况�Q�而坏球的可能�l�果有q₁轅R��q₁重、q₂轅R��q₂重、…、q_m轅R��q_m重等�?m�U�。因此，�Ҏ(gu��)��商农的信息论�Q�此问题的熵��是需要的�U�量�ơ数�Q�又因�ؓ(f��)n是整敎ͼ�所以有�Q?img alt="" hspace="0" src="http://blog.vckbase.com/images/vckbase_com/localvar/701/o_ball-01.gif" border="0" />

    不过理论�l�归是理论，直接拿到现实生活中往往行不通。一个很��单的情况�Q?个球�Q�上面的公式�?�ơ称量就够了(ji��n)。但你可以想惛_��法，反正我是没找��C��ơ解决问题的�Ҏ(gu��)��?

    那，是理论错�?ji��n)吗�Q�唔�Q�我可不敢怀疑商农，我只敢怀疑我自己。来看看我们错在哪了(ji��n)吧。对4个球的情况，�W�一�ơ称量只有两个可选的�Ҏ(gu��)��Q�方�?�Q�q₁攑ַ�盘，q₂攑֏�盘。若不��^衡（�׃��对称性，只分析左边轻的情况，下同�Q�，则可能的�l�果�q�剩q₁��d��q₂重，再称一�ơ就能找到坏球；若��^衡，则可能的�l�果�q�剩q₃轅R��q₃重、q₄��d��q₄�?个，再套用一下商农的定理�Q�此时还要称�ơ。所以方�?被否冟뀂方�?�Q�q₁、q₂攑ַ�盘，q₃、q₄攑֏�盘。此时天�q��定不�?x��)��^衡，�U�量后，可能的结果有q₁轅R��q₂轅R��q₃重和q₄�?个。同��L(f��ng)��道理�Q�方�?也难逃被否决的命�q��?/font>

    �?个球�q�么��单的情况下就撞得满头是包�Q�未免让人难以接受，�ȝ��一下经验教训吧�Q�把上面的分析归�U�一下�ƈ推广��C��般情况，��是�Q�整个称量过�E�中�Q�要辑ֈ�目的�Q�倒数�W�k�ơ称量前的可能结果数h�Q�必��L��x��件h�?^k�?/font>

    上面的得出的�l�论虽然不能让我们找到问题的�{�案�Q�但却有助于我们��定每次�U�量的方案，特别是第一�ơ如何做。假设我们计划的�U�量�ơ数是n�Q�第一�ơ在左右两盘中各放x个球�Q�则保证下面两个不等式同时成立是解决问题的必要条�Ӟ��(x��)

    2(m-2x)�?^n-1 �Q��^衡时�Q?/font>

    2x�?^n-1 �Q�不�q��Ӟ��(j��)

把这两个不等式稍加变换，��成�?ji��n)下面的样子�Q?/font>

注意到x是整敎ͼ�3n-1是奇敎ͼ�2m是偶敎ͼ�所以上面的不等式等价于�Q?/font>

昄��Q�在n一定的情况下，m��大�Q�x的取��D��围越��，而当x只能取�?img alt="" hspace="0" src="http://blog.vckbase.com/images/vckbase_com/localvar/701/o_ball-05.gif" border="0" />�Ӟ��m�l�箋增大�Q�就�?x��)导致n�ơ称量找到坏球的计划破��。籍此，可以得出在n一定的情况下m的取��D��_(d��)��(x��)。发��C��(ji��n)吗？现在m的最大值正好比我们最初的�l�果��了(ji��n)1。同时此�l�果也与前面提到�?个球的实际情�늛��W��?/font>

    但分析了(ji��n)半天�Q�我们只证明�?ji��n)m不在取��D��围内�Ӟ��n�ơ称量不能确保找到坏球。那m在取��D��围内的时候，肯定能找到吗�Q�答案是肯定的，不过马上证明它有炚w��Q�先来看两个��单一点的命题�?/font>

    命题1�Q�有A、B两组球，球的个数分别为a、b�Q�且0≤b-a�?�Q�已知这些球中有且仅有一个坏球，若它在A�l�中�Q�则比正常球轻，在B�l�中则比正常球重。另有一个好球。先使用无砝码的天��^�U�量�Q��o(h��)�Q�则可以扑ֈ�一个称量方案，使得最多经�q�n�ơ称量，��可以找到坏球（此时肯定能指出它与好球的重量关系�Q��?/font>

    使用数学归纳法证明如下：(x��)

    ①当n=1�Ӟ��a、b的取值可能有{0�Q?}、{1�Q?}、{1�Q?}三组�Q�由于还有一个已知的好球�Q�所以不��N��证此时命题成立�?br />    ②假讑ֽ�n=k时命题也成立�?br />    ③当n=k+1时。我们将A、B两组球分别尽量��^均得分�ؓ(f��)三组�Q�记为A1、A2、A3、B1、B2和B3。不影响一般性，假设�q�六�l�球按球��C��到多的排列�ơ序也与前面的顺序一��_(d��)��且A1有球a1个。则�W�一�ơ称量时的称量方案与每组球个数的对应关系如下�Q�其中需要注意的是：(x��)在带蓝色的两�U�情况下�Q�必�?img alt="" hspace="0" src="http://blog.vckbase.com/images/vckbase_com/localvar/701/o_ball-08.gif" border="0" />�Q�否则就与命题的前提不符�?ji��n)�?/font>

A1 A2 A3 B1 B2 B3 �U�量�Ҏ(gu��)��

a1 a1 a1 a1 a1 a1 A1、B1攑ַ�盘；A2、B2攑֏��?

a1 a1 a1 a1 a1 a1+1 A1、B1攑ַ�盘；A2、B2攑֏��?

a1 a1 a1+1 a1 a1 a1+1 A1、B3攑ַ�盘；A3、B1攑֏��?

a1 a1 a1+1 a1 a1+1 a1+1 A1、B2攑ַ�盘；A2、B3攑֏��?

a1 a1+1 a1+1 a1 a1+1 a1+1 A2、B2攑ַ�盘；A3、B3攑֏��?

a1 a1+1 a1+1 a1+1 a1+1 a1+1 A2、B2攑ַ�盘；A3、B3攑֏��?/font>

很明显，不管�l�果是什么，�W�一�ơ称量之后，问题都能转化为n=k时的情�Ş。所以，命题1是真命题�?/font>

    前面已经证明�Ӟ��n�ơ称量无法确保找到坏球�ƈ指出其轻重关�p�R��但如果此时也有一个已知的好球的话�Q�答案就不一样了(ji��n)�Q�这时n�ơ称量就已经��_��Q�命�?�Q�。仍使用数学归纳法�?/font>

    ①当n=2�Ӟ��m=4�Q�验证一下可知命题成立。�?br />    ②假讑ֽ�n=k时命题也成立。�?br />    ③当n=k+1时。我们把�q�些球尽量��^均的分成三组�Q�则每组球的个数分别为：(x��)�?img alt="" hspace="0" src="http://blog.vckbase.com/images/vckbase_com/localvar/701/o_ball-10.gif" border="0" />�?img alt="" hspace="0" src="http://blog.vckbase.com/images/vckbase_com/localvar/701/o_ball-11.gif" border="0" />。第一�ơ称量时�Q�第一�l�和那个好球攑ַ�盘，�W�三�l�放右盘。若�q��Q�问题�{化�ؓ(f��)n=k时的情�Ş�Q�不�q��Q�问题�{化�ؓ(f��)命题1的情形。命题成立�?

    有了(ji��n)前面两个证明作基��Q�最初的问题��很��单了(ji��n)�Q�再�ơ祭出数据学归纳法。由于m<5时的情况有些�Ҏ(gu��)��(考虑只有一个球或两个球的情�?�Q�不能作为递推得依据，所以我们从n=3�Q�也��是m=5开始�?/font>

    ①当n=3�Ӟ��m�?�?2之间�Q?3的情况已�l�被排除在外�Q�，通过一一验证可知命题成立。�?br />    ②假讑ֽ�n=k时命题也成立。�?br />    ③当n=k+1�Ӟ��扑ֈ�一个满��不�{�式的x�Q�在天��^左右两盘中各放x个球。如果天�q�_�^衡，问题转化为n=k时的情�Ş或命�?中的情�Ş�Q�不�q��Q�则转化为命�?的情形。命题成立�?/font>

    �l�g��所�q�ͼ��U�球问题的完整答案是�Q�当球数�Ӟ��n�ơ称量时��p��保扑ֈ�坏球�Q��ƈ指出它与好球的轻重关�p�；当球�?img alt="" hspace="0" src="http://blog.vckbase.com/images/vckbase_com/localvar/701/o_ball-09.gif" border="0" />�Ӟ��n�ơ称量只能确保找到坏球，而无法指出它与好球的轻重关系。要��x��重关�p�，��可能需要多�q�行一�ơ称量。但如果此时再有一个好球，��又可以把这�ơ称量省掉了(ji��n)�?br />
from: http://blog.vckbase.com/localvar/archive/2005/07/17/9717.aspx

weidagang2046 2006-04-03 10:11 发表评论

weidagang2046 — Sun, 30 Oct 2005 04:44:00 GMT

�q�回本讲概述

信号�?

信号量是最早出现的用来解决�q�程同步与互斥问题的机制�Q?BR>包括一个称��Z��号量的变量及(qi��ng)对它�q�行的两个原语操作�?BR>

本节��从以下几个斚w��q�行介绍--

一. 信号量的概念

1�Q?信号量的�c�d��定义

2�Q?PV原语

�? 实例

1�Q?生��?消费者问题（有buffer�Q?

2�Q?�W�一�c�读-写者问�?

3�Q?哲学安��?

一. 信号量的概念

1�Q?信号量的�c�d��定义

每个信号量至��须记录两个信息�Q�信号量的值和�{�待该信号量的进�E�队列。它的类型定义如下：(x��)�Q�用�c�PASCAL语言表述�Q?BR>    semaphore = record
         value: integer;
         queue: ^PCB;
       end;
  其中PCB是进�E�控制块�Q�是操作�pȝ��为每个进�E�徏立的数据�l�构�?BR>s.value>=0�Ӟ��s.queue为空�Q?
s.value<0�Ӟ��s.value的绝对��gؓ(f��)s.queue中等待进�E�的个数�Q?BR>

�q�回

2�Q?PV原语

对一个信号量变量可以�q�行两种原语操作�Q�p操作和v操作�Q�定义如下：(x��)   procedure p(var s:samephore);
     {
       s.value=s.value-1;
       if (s.value<0) asleep(s.queue);
     }
  procedure v(var s:samephore);
     {
       s.value=s.value+1;
       if (s.value<=0) wakeup(s.queue);
     }

其中用到两个标准�q�程�Q?BR>  asleep(s.queue);执行此操作的�q�程的PCB�q�入s.queue��N��Q�进�E�变成等待状�?BR>  wakeup(s.queue);��s.queue头进�E�唤醒插入就�l�队�?BR>s.value初��gؓ(f��)1�Ӟ��可以用来实现�q�程的互斥�?BR>p操作和v操作是不可中断的�E�序�D�，�U�Cؓ(f��)原语。如果将信号量看作共享变量，则pv操作为其临界区，多个�q�程不能同时执行�Q�一般用��g�Ҏ(gu��)��保证。一个信号量只能�|�一�ơ初��|��以后只能对之�q�行p操作或v操作�?BR>由此也可以看刎ͼ�信号量机制必��L��公共内存�Q�不能用于分布式操作�pȝ��Q�这是它最大的��q��?BR>

�q�回

�? 实例

1�Q?生��?消费者问题（有buffer�Q?

问题描述�Q?BR>  一个仓库可以存放K件物品。生产者每生��一件��品，��品放入仓库，仓库满了(ji��n)��停止生产。消费者每�ơ从仓库中去一件物品，然后�q�行消费�Q�仓库空时就停止消费�?BR>解答�Q?BR>  �q�程�Q�Producer - 生��者进�E�，Consumer - 消费者进�E?
  共有的数据结构：(x��)
     buffer: array [0..k-1] of integer;
     in,out: 0..k-1;
       �?in记录�W�一个空�~�冲区，out记录�W�一个不�I�的�~�冲�?
     s1,s2,mutex: semaphore;
       �?s1控制�~�冲��Z��?s2控制�~�冲��Z��I?mutex保护临界区；
         初始化s1=k,s2=0,mutex=1
  producer�Q�生产者进�E�）(j��)�Q?
   Item_Type item;
  {
     while (true)
     {
       produce(&item);
       p(s1);
       p(mutex);
       buffer[in]:=item;
       in:=(in+1) mod k;
       v(mutex);
       v(s2);
     }
  }

  consumer�Q�消费者进�E�）(j��)�Q?
   Item_Type item;
  {
     while (true)
     {
       p(s2);
       p(mutex);
        item:=buffer[out];
        out:=(out+1) mod k;
        v(mutex);
        v(s1);
       consume(&item);
     }
   }

例程演示

�q�回

2�Q?�W�一�c�读-写者问�?

问题描述�Q?BR>  一些读者和一些写者对同一个黑板进行读写。多个读者可同时读黑板，但一个时��d��能有一个写者，读者写者不能同时��用黑�ѝ��对使用黑板优先�U�的不同规定使读�?写者问题又可分为几�c�R��第一�c�问题规定读者优先��较高�Q�仅当无读者时允许写者��用黑�ѝ�?BR>解答�Q?BR>  �q�程�Q�writer - 写者进�E�，reader - 读者进�E?
  共有的数据结构：(x��)
     read_account:integer;
     r_w,mutex: semaphore;
       �?r_w控制谁��用黑�?mutex保护临界区，初值都�?
  reader - (读者进�E�）(j��)�Q?
  {
     while (true)
     {
       p(mutex);
       read_account++;
       if(read_account=1) p(r_w);
       v(mutex);
       read();
       p(mutex);
       read_account--;
       if(read_account=0) v(r_w);;
       v(mutex);
     }
  }

  writer - (写者进�E�）(j��)�Q?
  {
     while (true)
     {
       p(mutex);
        write();
        v(mutex);
     }
   }

例程演示

�q�回

3�Q?哲学安��?

问题描述�Q?BR>  一个房间内�?个哲学家�Q�他们的生活��是思考和�q�食。房间里有一张圆桌，中间攄��一盘通心(j��)�_�（假定通心(j��)�_�无限多�Q�。桌子周围放有五把椅子，分别属于五位哲学家每两位哲学家之间有一把叉子，哲学家进食时必须同时使用左右两把叉子�?BR>解答�Q?BR>  �q�程�Q�philosopher - 哲学�?
  共有的数据结�?amp;�q�程�Q?BR>     state: array [0..4] of (think,hungry,eat);
     ph: array [0..4] of semaphore;
       �?每个哲学家有一个信号量�Q�初��gؓ(f��)0
     mutex: semaphore;
       �?mutex保护临界区，初�?1
     procedure test(i:0..4);
     {
       if ((state[i]=hungry) and (state[(i+1)mod 5]<>eating)
       and (state[(i-1)mod 5]<>eating))
       { state[i]=eating;
          V(ph[i]);
       }
     }

  philosopher(i:0..4)�Q?
  {
     while (true)
     {
       think();
       p(mutex);
       state[i]=hungry;
       test(i);
       v(mutex);
       p(ph[i]);
       eat();
       p(mutex);
       state[i]=think;
       test((i-1) mod 5);
       test((i+1) mod 5);
       v(mutex);
     }
  }

例程演示

�q�回

weidagang2046 2005-10-30 12:44 发表评论

理解计算

weidagang2046 — Wed, 11 May 2005 16:27:00 GMT
随着计算机日益广泛而深�ȝ��q�用�Q�计��这个原本专门的数学概念已经泛化��C��(ji��n)人类的整个知识领域，�q�上升�ؓ(f��)一�U�极为普适的�U�学概念和哲学概念，成�ؓ(f��)��Z��认识事物、研�I��题的一�U�新视角、新观念和新�Ҏ(gu��)��?/FONT>
什么是计算与计��的�c�d��

    在大众的意识里，计算首先指的��是数的加减乘除�Q�其�ơ则为方�E�的求解、函数的微分�U�分�{�；懂的多一点的人知道，计算在本质上�q�包括定理的证明推导。可以说�Q�“计��”是一个无��Z��知元��Z��晓的数学概念�Q�但是，真正能够回答计算的本质是什么的人恐怕不多。事实上�Q�直�?930�q�代�Q�由于哥德尔�Q�K.Godel�Q?906-1978�Q�、丘�?A.Church�Q?903-1995)、图�?A.M.TUI-ing�Q?912-1954)�{�数学家的工作，��Z��才弄清楚什么是计算的本质，以及(qi��ng)什么是可计��的、什么是不可计算的等�Ҏ(gu��)��性问题�?/FONT>

    抽象地说�Q�所谓计��，��是从一个符号串f变换成另一个符号串g。比如说,从符号串12+3变换�?5��是一个加法计��。如果符号串f�?IMG height=15 src="http://cfc.nankai.edu.cn/readings/image/lijie/1.jpg" width=15>�Q�而符号串g�?x,从f到g的计��就是微分。定理证明也是如此，令f表示一�l�公理和推导规则�Q��o(h��)g是一个定�?那么从f到g的一�p�d��变换��是定理g的证明。从�q�个角度看，文字��译也是计算�Q�如f代表一个英文句子，而g为含意相同的中文句子�Q�那么从f到g��是把英文翻译成中文。这些变换间有什么共同点�Q��ؓ(f��)什么把它们都叫做计��？因�ؓ(f��)它们都是从己知符�?�?开始，一步一步地改变�W�号(�?�Q�经�q�有限步骤，最后得��C��个满��预先规定的�W�号(�?的变换过�E��?/FONT>

    从类型上�Ԍ��计算主要有两大类�Q�数��D��和�W�号推导。数��D��包括实数和函数的加减乘除、幕�q�算、开方运��、方�E�的求解�{�。符��h��导包括代��C��各种函数的恒�{�式、不�{�式的证�?几何命题的证明等。但无论是数��D��还是符��h��?它们在本质上是等��L(f��ng)��、一致的�Q�即二者是密切兌��的，可以�怺�转化�Q�具有共同的计算本质。随着数学的不断发�?�q�可能出现新的计��类型�?/FONT>

计算的实质与E奇－囄��论点

    ��Z��(ji��n)回答�I�竟什么是计算、什么是可计��性等问题�Q��h们采取的是徏立计��模型的�Ҏ(gu��)��。从20世纪30�q�代�?0�q�代�Q�数理逻辑学家相��提出�?ji��n)四�U�模型，它们是一般递归函数、��d��计算函数、图灉|��和�L斯特(E.L.Post�Q?897-1954)�pȝ��。这�U�种模型完全从不同的角度探究计算�q�程或证明过�E�，表面上看区别很大�Q�但事实上却是等��L(f��ng)��Q�即它们完全��h��一��L(f��ng)��计算能力D在这一事实基础上，最�l��Ş成了(ji��n)如今著名的丘�?囄��论点�Q�凡是可计算的函数都是一般递归函数(或是囄��机可计算函数�{?。这��q��立了(ji��n)计算与可计算性的数学含义。下面主要对一般递归函数作一��要介�l��?/FONT>

    哥�d��?d��ng)首先�?931�q�提��Z��(ji��n)原始递归函数的概��c(di��n)��所谓原始递归函数,��是由初始函数出发，�l�过有限�ơ的使用代�h与原始递归式而做出的函数。这里所说的初始函数是指下列三种函数�Q?/FONT>

    (1) 零函�?(x)=0(函数值恒为零)�Q?/FONT>

    (2) ��媄(ji��ng)函数(x1,x2,�?xn)=xi(1≤i≤n)(函数的��g��W�i个自变元的值相�?�Q?/FONT>

    后��函数S(x)=x+1(其��gؓ(f��)x的直接后�l�数)�?/FONT>

    代�h与原始递归式是构造新函数的算子�?/FONT>

    代�h(又名叠置、�P�|?�Q�它是最��单又最重要的算�?其一般�Ş式是:�׃��个m元函数f与m个n元函数g1�Q�g2�Q�…，gm造成新函数f(g1(x1,x2,�?xn),g2(x1,x2,�?xn),�?gm(x1,x2,�?xn))�?/FONT>

    原始递归式，其一般�Ş式�ؓ(f��)

    �Ҏ(gu��)��Cؓ(f��)

其特�Ҏ(gu��)��Q�不能由g,h两已知函数直接计��新函数的一般值f(u,x),而只能依�ơ计��f(u,0)�Q�f(u,1)�Q�f(u,2)�Q�…；但只要依�ơ计��，必能把�Q何一个f(u,x)�Q�对值都��出来。换句话��_(d��)��只要g,h有定义且可计��，则新函数f也有定义且可计算�?/FONT>

    �Ҏ(gu��)��埃尔布朗(J.Herbrand�Q?908-1931)一��信的暗�C�，哥�d��?d��ng)�?934�q�引�q�了(ji��n)一般递归函数的概��c(di��n)��后�l�克�?S.C.Kleene�Q?909-1994)的改�q�与阐明�Q�便出现�?ji��n)现在普遍采用的定义。所谓一般递归函数�Q�就是由初始函数出发�Q�经�q�有限次使用代�h、原始递归式和μ��子而做成的有定义的函数�?�q�里的μ算子就是造逆函数的��子或求根算子�?/FONT>

    如此定义的一般递归函数比原始递归函数更广�Q�这是没有�Q何疑问的。但是，��Z��q�是可以问：(x��)�q�样定义的函数是否已�l�包括了(ji��n)所有直观上的可计算函数�Q�如果还有更�q�的可计��函数又该怎样定义�Q�在受到�q�类问题困惑的同�Ӟ��丘奇、克林又提出�?ji��n)一�c�d��计算函数�Q�叫做��d��计算函数。但事隔不久�Q�丘奇和克林便分别证明了(ji��n)λ可计��函数正好就是一般递归函数�Q�即�q�两�c�d��计算函数是等��L(f��ng)��、一致的。在�q�一有力的证据基��上，丘奇�?936�q�公开发表�?ji��n)他早在两年前就孕育�q�的一个论点，卌��名的丘奇论点�Q�每个能行地可计��的函数都是一般递归函数�?/FONT>

    与此同时�Q�图灵定义了(ji��n)另一�c�d��计算函数�Q�叫做图灉|��可计��性函�?�q�且提出�?ji��n)著名的囄��论点�Q�能行可计算函数都是用图灉|��可计��的函数。图灉|��是图灉|��出的一�U�计��模型，或一台理��机口它可以说是对�h�c�计��与机器计算的最一般、最高度的抽象。一�q�后�Q�图灵进一步证明了(ji��n)囄��机可计算函数与��d��定义函数是一致的�Q�当然也��和一般递归函数一致、等仗��于是，表面上不同的三类可计��函数在本质上就是一�c�R��这样一来，丘奇论点和图灵论点也��是一回事�?ji��n)，现将它们合称��Z��?囄��论点�Q�即直观的能行可计算函数�{�同于一般递归函数、可λ定义函数和图灉|��可计��函数�?/FONT>

    丘奇�Q�图灵论点的提出�Q�标志着人类对可计算函数与计��本质的认识辑ֈ��?ji��n)空前的高度�Q�它是数学史上一块夺目的里程��?/FONT>

    一般递归函数比较抽象�Q��ؓ(f��)此给��Z��U�较为直观的解释。大家知道，凡能够计��的�Q�即使是“心(j��)��”，��d��以把其计��过�E�记录下来，而且是逐个步骤逐个步骤地记录下来。所谓计��过�E�，是指从初始符��h��已知�W�号开始，一步一步地改变(变换)�W�号�Q�最后得��C��个满��预先规定的条�g的符��P��q�从该符��h��照一定方法得到所求结果，��x��求函数的值的全过�E�。可如此计算的函敎ͼ�一般称为可以在有限步骤内计��的函数。现已证明：(x��)凡是可以从某些初始符号开始，而在有限步骤内计��的函数都是递归函数。由此可以看刎ͼ�“能够记录下来”便�W�合�?ji��n)可计算性或递归性的本质要求。一般递归函数的实质也由此昑־�十分直观易懂�?/FONT>

    丘奇�Q�图灵论点的提出与确认，在数学和计算机科学上��h��重大的理论和现实意义。正如我国数理逻辑专家莫绍揆教授所�a��Q�有�?ji��n)这个论点以后，��可以断定某些问题是不能能行地解��x��不能能行地判定的。对于计��机�U�学�Q�丘�?囄��论点的意义在于它明确�ȝ��?ji��n)计��机的本质或计算机的计算能力�Q�确定了(ji��n)计算机只能计��一般递归函数�Q�对于一般递归函数之外的函敎ͼ�计算机是无法计算的�?/FONT>

DNA计算:新型计算方式的出�?/FONT>

    1994�q?1月，��国计算机科学家阿�d勒曼(L.Adleman)在美国《科学》上公布DNA计算机的理论�Q��ƈ成功�q�用DNA计算��决了(ji��n)一个有向哈密顿路径问题�?DNA计算机的提出�Q��生于�q�样一个发玎ͼ�即生物与数学的相似性：(x��)(1)生物体异常复杂的�l�构是对由DNA序列表示的初始信息执行简单操�?复制、剪�?的结果；(2)可计��函数f(ω)的结果可以通过在ω上执行一�p�d��基本的简单函数而获得�?/FONT>

    阿�d勒曼不仅意识到这两个�q�程的相似性，而且意识到可以利用生物过�E�来模拟数学�q�程。更��切地说是，DNA串可用于表示信息�Q�酶可用于模拟简单的计算。这是因为：(x��)首先�Q�DNA是由�U�C��核昔酸的一些单元组成，�q�些核昔酔R��着附在其上的化学组或基的不同而不同。共有四�U�基�Q�腺嘌呤、鸟嘌呤、胞(y��u)嘧啶和胸腺嘧�Ӟ��分别用A、G、C、T表示。单链DNA可以看作是由�W�号A、G、C、T�l�成的字�W�串。从数学上讲�Q�这意味着可以用一个含有四个字�W�的字符集∑ =A、G、C、T来�ؓ(f��)信息�~�码(�?sh��)子计算��Z��使用0�?�q�两个数�?。其�ơ，DNA序列上的一些简单操作需要酶的协助，不同的酶发挥不同的作用。�v作用的有四种�Ӟ��(x��)限制性内切酶�Q�主要功能是切开包含限制性位点的双链DNA�Q�DNA�q�接�?它主要是把一个DNA铄��端点同另一个链�q�接在一��P��DNA聚合�?它的功能包括DNA的复制与�?j��)进DNA的合成；外切�Ӟ��它可以有选择地破坏双链或单链DNA分子。正是基于这四种酶的协作实现�?ji��n)DNA计算�?/FONT>

    不过�Q�目前DNA计算��够处理的问题�Q�还仅仅是利用分子技术解决的几个特定问题�Q�属一�ơ性实验。DNA计算��没有一个固定的�E�式。由于问题的多样性，��D��所采用的分子生物学技术的多样性，具体问题需要设计具体的实验�Ҏ(gu��)��口这便引��Z��(ji��n)两个�Ҏ(gu��)��性问�?也是阿�d勒曼最早意识到�?�Q?1)DNA计算机可以解军_��些问题确切地��_(d��)��DNA计算机是完备的吗�Q�即通过操纵DNA能完成所有的(囄��?可计��函数吗�Q?2)是否可设计出可编�E�序的DNA计算机？��x��否存在类��g��?sh��)子计算机的通用计算模型——图灉|��——那��L(f��ng)��通用DNA�pȝ��(模型)�Q�目前，��Z��正处在对�q�两个根本性问题的研究�q�程之中口在�W�者看来，�q�就�c�M��于在�?sh��)子计算��生之前�?0世纪三四十年代理��机的研�I��D�c(di��n)��如今，已经提出�?ji��n)多�U�DNA计算模型�Q�但各有千秋�Q�公认的DNA计算机的“图灉|��”还没有诞生。相对而言�Q�一�U�被�U�Cؓ(f��)“剪接系�l�”的DNA计算机模型较为成功�?/FONT>

    有了(ji��n)“剪接系�l�”这个DNA计算机的数学模型后，便可以来回答前面提出的DNA计算的完备性与通用性问题。前面讲�q�，丘奇-囄��论点深刻地刻��M��(ji��n)��M��实际计算机的计算能力——�Q何可计算函数都是可由囄��的函数(一般递归函数)。现已证明：(x��)剪接�pȝ��是计��完备的�Q�即��M��可计��函数都可用剪接�pȝ��来计��D反之亦然。这��回�{�了(ji��n)DNA计算机可以解军_��些问题——全部图灉|��可计��问题。至于是否存在基于剪接的可编�E�计��机�Q�也有了(ji��n)肯定的答案：(x��)�Ҏ(gu��)��个给定的字符集T�Q�都存在一个剪接系�l�，其公理集和规则集都是有限的，而且对于以T为终�l�字�W�集的一�cȝ��l�是通用的。这��是��_(d��)��理论上存在一个基于剪接操作的通用可编�E�的DNA计算机。这些计��机使用的生物操作只有合成、剪�?切割-�q�接)和抽取�?/FONT>

    DNA计算机理论的出现意味着计算方式的重大变革。当�?d��ng)��引�v计算方式重大变革的远不止DNA计算机，光学计算机、量子计��机、蛋白质计算机等新型计算机模型层��Z��I�P��它们使原有的计算方式发生�?ji��n)前所未有的变化�?/FONT>

计算方式�?qi��ng)其演�?/FONT>

    ��单地�Ԍ��所谓计��方式就是符号变换的操作方式�Q�尤其指最基本的动作方式。广义地�Ԍ��q�应包括�W�号的蝲体或�W�号的外在表现�Ş式，亦即信息的表征或表达。比如，中国古代的筹��，��是用一�l�竹��表征的计算方式�Q�后来的珠算则是用算盘或��珠表征的计��方式，再后来的�W�算又是一�U�用文字�W�号表征的计��方式，�q�一�p�d��计算方式的变化，表现��方式的多样性与不断�q�化的趋�ѝ��相对于后来出现的机器计��方式，上述各种计算方式均可归结为“手工计��方式”，其特�Ҏ(gu��)��用手工操作符��P��实施�W�号的变换�?/FONT>

    不过�Q�真正具有革命性的计算方式�Q�还是随着�?sh��)子计算机的产生才出现的。机器计��的历史可以�q�溯�?641�q�_(d��)��当年18岁的法国数学家帕斯卡从机械时钟得到启�C�：(x��)齿轮也能计数�Q�于是成功地制作�?ji��n)一台��轮传动的八位加法计算机口�q��人类计算方式、计��技术进入了(ji��n)一个新的阶�D�c(di��n)��后来经�q��h们数癑ֹ�的艰辛努力，�l�于�?945�q�成功研制出�?ji��n)世界上�W�一台电(sh��)子计��机。从此，人类�q�入�?ji��n)一个全新的计算技术时代�?/FONT>

    从最早的帕斯卡��轮机��C��天最先进的电(sh��)子计��机�Q�计��机已经历了(ji��n)四大发展时期。计��技术有�?ji��n)长��的发展。这时计��表��Cؓ(f��)一�U�物理性质的机械的操作�q�程。符号不再是用竹��、算珠、字母表征，而是用��轮表征，用电(sh��)��表征，用电(sh��)压表征等�{�。但是，无论是手工计��还是机器计��，其计��方式——操作的基本动作都是一�U�物理性质的符号变�?具体是由“加”“减”这�U�基本动作构�?。二者的区别在于�Q�前者是手工的，�q�算速度比较慢；后者则是自动的�Q�运��速度极快�?/FONT>

    如今出现的DNA计算无疑有着更大的本质性变化，计算不再是一�U�物理性质的符号变换，而是一�U�化学性质的符号变换，即不再是物理性质的“加”“减”操作，而是化学性质的切割和�_�脓(chu��ng)、插人和删除。这�U�计��方式将��d��改变计算机硬件的性质�Q�改变计��机基本的运作方式，其意义将是极为深�q�的。阿德勒曼在提出DNA计算机的时候就�怿��Q�DNA计算机所蕴涵的理念可使计��的方式产生�q�化�?/FONT>

    量子计算机在理论上的出现�Q��计算方式的进化又有了(ji��n)新的可能。电(sh��)子计��机的理论模型是�l�典的通用囄��机——一�U�确定型囄��机，量子计算机的理论模型——量子图灉|��则是一�U�概率型囄��机。直观一些说�Q�传�l�电(sh��)脑是通过��芯片上微型晶体��电(sh��)位的“开”和“关”状态来表达二进位制�?�?�Q�从而进行信息数据的处理和储存。每个电(sh��)位只能处理一个数据，�?�?�Q�许多个�?sh��)位依次串连��h��Q�才能共同完成一�ơ复杂的�q�算。这�U�线性计��方式遵循普通的物理学原则，��h��明显的局限性。而量子计��机的运��方式则建立在原子运动的层面上，�H�破�?ji��n)分子物理的界限。根据量子论原理�Q�原子具有在同一时刻处于两个不同位置、又同时向上下两个相反方向旋转的�Ҏ(gu��)��，�U�Cؓ(f��)“量子超态”。而一旦有外力�q�扰�Q�模�p�运动的原子又可以马上归于准��的定位。这�U�似是而非的�؜沌状态与��Z��熟知的常规世界相矛盾�Q�但如果利用其表达信息，却能发挥出其瞬息之间千变万化而又万变不离其宗的神奇功效。因为当许多个量子状态的原子�U�缠在一��h��Q�它们又因量子位的“叠加性”，可以同时一起展开“�ƈ行计��”，从而��其具备超高速的�q�算能力。电(sh��)子线性计��方式如同万只蜗牛排队过独木桥，而量子�ƈ行运��好比万只飞鸟同时升上天�I��?/FONT>

计算方式演变的意�?/FONT>

    计算方式的不断进化有着十分重要的理论意义和现实意义�Q�笔者认��表明以下两斚w��。其一�Q�计��方式是一�U�历史的�l�果�Q�而非计算本性的逻辑必然。加拿大的卡�?L.Kari)指出�Q�“DNA计算是考察计算问题的一�U�全新方式。或许这正是大自然做数学的方法：(x��)不是用加和减�Q�而是用切割和�_�脓(chu��ng)、用插入和删除。正如用十进制计数是因�ؓ(f��)我们有十个手指那��P��或许我们目前计算中的基本功能仅因��Z�h�c�d��史��然。正如�h们已�l�采用其他进制计��C��P��或许现在是考虑其他的计��方式的时候了(ji��n)。”笔者以为，�q�一说法是很有启�C�性的。确实，仔细回顾一下�h�c�计��方式或计算技术的历史,��׃��难体�?x��)到计算方式是一�U�历史的�l�果�Q�而非计算本性的逻辑必然�?/FONT>

    也就是说�Q�计��之所以�ؓ(f��)计算�Q�在于它��h��一�U�根本的递归性，或在于它是一�U�可一步一步进行的�W�号串变换操作。至于这�U�符号变换的操作方式如何�Q�以�?qi��ng)符��L(f��ng)��载体或其外在表现形式如何�Q�都不是本质性的东西�Q�它们元不是一�U�历史的�l�果�Q�无不处于一�U�不断变革或�q�化的过�E�之中。不同表征下的符号变换有着不同的操作方式，甚至同一�U�表征下的符号变换都可以有不同的操作方式�Q�既可以是物理性的方式�Q�也可以是化学性的方式�Q�即可以是经典的方式,也可以是量子的方式；既可以是��定性的方式�Q�也可以是概率性的方式。在此，计算本质的统一性与计算方式的多��h��得��C��(ji��n)深刻的体现。笔者相信，DNA计算机、量子计��机�{�的出现已经打开�?ji��n)�h们畅��x��来计��方式的思维视窗�Q�随着�U�学技术的不断发展�Q�计��方式的多样性还�?x��)有新的表现�?/FONT>

    其二�Q�计��方式的历史性、多��h��反观了(ji��n)计算本性的逻辑必然性、统一性。由丘奇-囄��论点所揭示的计��本质是非常普适的�Q�它不仅包括数��D��、定理推导等不同形式的计��，而且包括��、电(sh��)子计��机�{�不同“计��器”的计算。大家不要忘�?ji��n)，以丘�?囄��论点为基石的可计��性理论是在电(sh��)子计��机诞生之前�?930�q�代提出的，卛_��q��在对�?sh��)子计算��行�ȝ��与抽象的基础上提出，但又深刻地刻��M��(ji��n)�?sh��)子计算机的计算本质。如今最先进的电(sh��)子计��机在本质上��是一台图灉|��Q�或者凡是计��机可计��的函数都是一般递归函数。现在�h们又�q�一步认识到�Q�目前尚在实验室阶段的DNA计算机、量子计��机�Q�在本质上也是一�U�图灵计��。这说明不同形式的计��、不同“计��器”的计算�Q�在计算本质上是一致的�Q�这��是递归计算或图灵计��?BR>
转自�Q?A >http://cfc.nankai.edu.cn/readings/lijie.htm

weidagang2046 2005-05-12 00:27 发表评论

A1	A2	A3	B1	B2	B3	�U�量�Ҏ(gu��)��
a1	a1	a1	a1	a1	a1	A1、B1攑ַ�盘；A2、B2攑֏��?
a1	a1	a1	a1	a1	a1+1	A1、B1攑ַ�盘；A2、B2攑֏��?
a1	a1	a1+1	a1	a1	a1+1	A1、B3攑ַ�盘；A3、B1攑֏��?
a1	a1	a1+1	a1	a1+1	a1+1	A1、B2攑ַ�盘；A2、B3攑֏��?
a1	a1+1	a1+1	a1	a1+1	a1+1	A2、B2攑ַ�盘；A3、B3攑֏��?
a1	a1+1	a1+1	a1+1	a1+1	a1+1	A2、B2攑ַ�盘；A3、B3攑֏��?/font>

中文字幕最新精品,国产精品一卡二卡三卡,久久精品国产亚洲一区二区

Map Reduce - the Free Lunch is not over?

Can Your Programming Language Do This?

This item ran on the Joel on Software homepage on Tuesday, August 01, 2006

Partial Evaluation - An Overview

Program Specialization

Specialization Examples

Interest of Specialization

Partial Evaluation

Applications of Partial Evaluation

Off-line vs. On-line Partial Evaluation

Binding-Time Analysis

Compile-Time Specialization

Run-Time Specialization

References

Footnotes

理论计算机初步：(x��)从hash函数到王���云的MD5破解

Similarity Flooding

Building Classification Models: ID3 and C4.5

Introduction

You can run PAIL to see how ID3 generates the decision tree [you need to have an X-server and to allow access (xhost) from yoda.cis.temple.edu].

You can run the C45 program here [you need to have an X-server and to allow access (xhost) from yoda.cis.temple.edu].

Classification Models in the Undergraduate AI Course

理解计算

理论计算机初步：(x��)从hash函数到王��云的MD5破解