www.在线视频,性网站在线看,一本到av在线

整数转字�W�串

calvinlau — Sat, 26 Sep 2009 07:41:00 GMT

void IntToStr(int a,char* str){
    if(a==0){
        *str='0';
        *(str+1)='\0';
        return;
    }

    char* p = str;
    if(a<0){
        a=a*(-1);
        *p++ = '-';
    }
    int len = 0;
    while(a){
        *p++ = a%10+'0';
        a/=10;
        ++len;
    }
    int start = *str=='-'?1:0;
    int tmp;
    for(int i=0;i         tmp = str[start+i];
        str[start+i]=str[len+start-1-i];
        str[len+start-1-i]=tmp;
    }
    str[len+start]='\0';
}
void main(){

    char* str = new char[12];
    //IntToStr(0,str);
    IntToStr(-12340,str);
    //IntToStr(214748367,str);
    printf("%s\n",str);
}

calvinlau 2009-09-26 15:41 发表评论

�Q�zz�Q?x&(x-1)表达式的意义

calvinlau — Sun, 19 Jul 2009 07:27:00 GMT

http://hi.baidu.com/zengzhaonong/blog/item/7fb884509ee30c61853524c2.html

x&(x-1)表达式的意义

求下面函数的�q�回�?微��Y) -- �l�计1的个�?/strong>
-------------------------------------
int func(int x)
{
    int countx = 0;
    while(x)
    {
        countx++;
        x = x&(x-1);
    }
    return countx;
}

假定x = 9999
10011100001111
�{�案: 8

思�\: ��x转化�?�q�制�Q�看含有�?的个数�?br /> �? 每执行一�ơx = x&(x-1)�Q�会��x用二�q�制表示时最双��的一�?变�ؓ0�Q�因为x-1��会��该�?x用二�q�制表示时最双��的一�?)变�ؓ0�?br />

判断一个数(x)是否�?的n�ơ方
-------------------------------------
#include

int func(int x)
{
    if( (x&(x-1)) == 0 )
        return 1;
    else
        return 0;
}

int main()
{
    int x = 8;
    printf("%d\n", func(x));
}

�?
(1) 如果一个数�?的n�ơ方�Q�那么这个数用二�q�制表示时其最高位�?�Q�其余位�?�?br />
(2) == 优先�U�高�?&

calvinlau 2009-07-19 15:27 发表评论

计算整数的二�q�制表示有多��个1

calvinlau — Sun, 19 Jul 2009 06:38:00 GMT

#include<stdio.h>
#include<stdlib.h>

unsigned long count_one(unsigned long data)
{
    unsigned long count = 0;
    unsigned long x = data;
    while(x)
    {
        count++;
        x = x & (x-1);
    }
    return count;
}

int main(){
    unsigned long data[] = {13,16,25,31,76};
    int i = 0;
    int size = sizeof(data)/sizeof(unsigned long);
    for(i=0;i<size;i++){
        printf("%d has %d 1s\n",data[i],count_one(data[i]));
    }
    return 0;
}

calvinlau 2009-07-19 14:38 发表评论

数组循环位移

calvinlau — Sun, 07 Jun 2009 04:00:00 GMT
�l�定有N个元素数�l�，��之循环�U�K位，不能使用库函敎ͼ�不能使用辅助数组�Q�要求时间复杂度为O(N)

解法1�Q?br /> 思�\�Q?br /> �Q?�Q?整个数组倒序
�Q?�Q? - K位倒序
�Q?�Q�K - (N-1)位倒序

代码�Q?br />
void printArray(int a[],int n){

    for(int i=0;i<n;i++){
        printf("%d\t",a[i]);
    }
    printf("\n");
}

void reverse(int a[], int begin, int end){
    int n = (end-begin+1)/2;
    for(int i=0;i<n;i++){
        int t = a[begin+i];
        a[begin+i] = a[end-i-1];
        a[end-i-1] = t;
    }
}

void shift(int a[], int n, int k){
    k = (n+k%n)%n;
    reverse(a,0,n);
    reverse(a,0,k);
    reverse(a,k,n);
}

void main(){
    int a[] = {1,2,3,4,5,6,7,8};
        int n = sizeof(a)/sizeof(int);
    printArray(a,n);
    //shift(a,n,-1);
        shift(a,n,4);
    printArray(a,8);
}

解法2�Q?br />

void Output(int *pBuffer, int nCount)
{
    if(!pBuffer || !nCount) return;

    for (size_t i = 0; i < nCount; i++)
    {
        printf(" %d ", pBuffer[i]);
    }

    printf("\n");

}

void ShiftN(int *pBuffer, int nCount, int nShiftN)
{
    if(!pBuffer || !nCount || !nShiftN) return;

    nShiftN %= nCount;

    int nIndex = 0;
    int nStart  = nIndex;

    int nTemp  = pBuffer[nIndex];

    for (size_t i = 0; i < nCount; i++)
    {
        nIndex = (nIndex + nShiftN) % nCount;

        pBuffer[nIndex] ^= nTemp ^=
        pBuffer[nIndex] ^= nTemp ;

        if(nIndex == nStart)
        {
            nStart ++;
            nIndex = nStart;
            nTemp = pBuffer[nIndex];
        }
    }
}

int main(int argc, char* argv[])
{
    int buffer[] = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12};

    int nCount = sizeof(buffer) / sizeof(int);

    Output(buffer, nCount);

    ShiftN(buffer, nCount, 8);

    Output(buffer, nCount);

    return 0;
}

calvinlau 2009-06-07 12:00 发表评论

calvinlau — Wed, 03 Jun 2009 14:47:00 GMT
相关定义�Q?br />

struct LNode{
     int e;
     LNode* next;
};

typedef struct LNode* LinkList;

非递归�Ҏ��Q?br />

//l 是带头结点的单链�?br /> void ReverseList(LinkList l){
     if(l==NULL || l->next == NULL)
         return;
     LNode *p, *q, *r;
     p = l->next;
     q = p->next;
     while( q != NULL){
         r = q->next;
         q->next = p;
         p = q;
         q = r;
     }

     l->next->next = NULL;
     l->next = p;
}

递归�Ҏ��Q?br />

LNode* ReverseList_Recursive(LNode* pNode,LinkList& l){

     if ( (pNode == NULL) || (pNode->next == NULL) ){
         l->next->next = NULL;
         l->next = pNode;
         return pNode;
     }

     LNode* temp = ReverseList_Recursive(pNode->next, l);
     temp->next = pNode;
     return pNode;
}

calvinlau 2009-06-03 22:47 发表评论

判断数组中的重复元素

calvinlau — Mon, 01 Jun 2009 17:00:00 GMT
一个数�l�，下标�?到n�Q�元素�ؓ�?到n的整数。判断其中是否有重复元素

1 void Find_Duplicate(int a[],int n){
2
3     unsigned char* bitmap = new unsigned char[n];
4     memset(bitmap,0,n);
5     int count = 0;
6     for(int i=0; i<n; i++){
7         if(a[i]>n || a[i]<0)
8             continue;
9         else if( bitmap[a[i]] != 1)
10             bitmap[a[i]] = 1;
11         else
12             count++;
13     }
14     delete[] bitmap;
15     printf("Duplicate count: %d\n",count);
16 }

calvinlau 2009-06-02 01:00 发表评论

�Q��{�Q�数学之��?�p�d��?-- 谈谈中文分词

calvinlau — Tue, 26 May 2009 16:04:00 GMT

数学之美 �p�d��?-- 谈谈中文分词
http://googlechinablog.com/2006/04/blog-post_10.html
2006�q?�?0�?上午 08:10:00
发表�? 吴军�Q?Google 研究�?

谈谈中文分词
----- �l�计语言模型在中文处理中的一个应�?br />
上回我们谈到利用�l�计语言模型�q�行语言处理�Q�由于模型是建立在词的基��上的�Q�对于中日韩�{�语�a��Q�首先需要进行分词。例如把句子 “中国航天官员应邀到美国与太空�ȝ�v官员开会�?#8221;

分成一串词�Q?br /> 中国 / 航天 / 官员 / 应邀 / �?/ ��国 / �?/ 太空 / �ȝ�v / 官员 / 开会�?br />
最�Ҏ��惛_��的，也是最��单的分词办法��是查字典。这�U�方法最早是由北京航天航�I�大学的梁南元教授提出的�?br />
�?“查字�?#8221; 法，其实��是我们把一个句子从左向��x��描一遍，遇到字典里有的词��标识出来，遇到复合词（比如 “上�v大学”�Q�就找最长的词匹配，遇到不认识的字串��分割成单字词，于是��单的分词��完成了。这�U�简单的分词�Ҏ��完全能处理上面例子中的句子。八十年代，哈工大的王晓龙博�?/a>�? 它理论化�Q�发展成最��词数的分词理论�Q�即一句话应该分成数量最��的词串。这�U�方法一个明昄��不��是当遇到有二义�? �Q�有双重理解意思）的分割时��无能�ؓ力了。比如，对短�?“发展中国�?#8221; 正确的分割是“发展-�?国家”�Q�而从左向��x��字典的办法会��它分割�?#8220;发展-中国-�?#8221;�Q�显然是错了。另外，�q��所有的最长匹配都一定是正确的。比�?#8220; 上�v大学城书�?#8221;的正��分词应该是 “上�v-大学�?书店�Q?#8221; 而不�?“上�v大学-�?书店”�?br />
九十�q�代以前�Q��v内外不少学者试囄��一些文法规则来解决分词的二义性问题，都不是很成功�?0�q�前后，清华大学的郭�q�博士用�l�计语言模型成功解决分词二义性问题，��汉语分词的错误率降低了一个数量��?br />
利用�l�计语言模型分词的方法，可以用几个数学公式简单概括如下：
我们假定一个句子S可以有几�U�分词方法，��Z��单�v见我们假定有以下三种�Q?br /> A1, A2, A3, ..., Ak,
B1, B2, B3, ..., Bm
C1, C2, C3, ..., Cn

其中�Q�A1, A2, B1, B2, C1, C2 �{�等都是汉语的词。那么最好的一�U�分词方法应该保证分完词后这个句子出现的概率最大。也��是说如�?A1,A2,..., Ak 是最好的分法�Q�那�?�Q�P 表示概率�Q�：
P (A1, A2, A3, ..., Ak�Q?�?P (B1, B2, B3, ..., Bm), �q�且
P (A1, A2, A3, ..., Ak�Q?�?P(C1, C2, C3, ..., Cn)
因此�Q�只要我们利用上回提到的�l�计语言模型计算出每�U�分词后句子出现的概率，�q�找出其中概率最大的�Q�我们就能够扑ֈ�最好的分词�Ҏ��?br />
当然�Q�这里面有一个实现的技巧。如果我们穷举所有可能的分词�Ҏ��q�计��出每种可能性下句子的概率，那么计算量是相当大的。因此，我们可以把它看成是一�?a target="_blank" >动态规�?/a>�Q�Dynamic Programming) 的问题，�q�利�?“�l�特�?#8221;�Q?a target="_blank" >Viterbi�Q?��法快速地扑ֈ�最佛_��词�?br />
在清华大学的郭进博士以后�Q��v内外不少学者利用统计的�Ҏ��Q�进一步完善中文分词。其中值得一提的是清华大学孙茂松教授和香港科技大学吴�d凯教授的工作�?br />
需要指出的是，语言学家对词语的定义不完全相同。比如说 “北京大学”�Q�有��为是一个词�Q�而有��分成两个词。一个折中的解决办法是在分词的同�Ӟ��扑ֈ�复合词的嵌套�l�构。在上面的例子中�Q�如果一句话包含“ 北京大学”四个字，那么先把它当成一个四字词�Q�然后再�q�一步找出细分词 “北京” �?“大学”。这�U�方法是最早是郭进�? “Computational Linguistics” �Q�《计��机语言学》）杂志上发表的�Q�以后不��系�l�采用这�U�方法�?br />
一般来�Ԍ��? 据不同应用，汉语分词的颗�_�度大小应该不同。比如，在机器翻译中�Q�颗�_�度应该大一些，“北京大学”��׃��能被分成两个词。而在语音识别中，“北京大学”一�? 是被分成两个词。因此，不同的应用，应该有不同的分词�pȝ��。Google 的葛昑��^博士和朱安博士，专门为搜索设计和实现了自��q��分词�pȝ��?br />
�? �怽�想不刎ͼ�中文分词的方法也被应用到��p��处理�Q�主要是手写体识别中。因为在识别手写体时�Q�单词之间的�I�格��׃��很清楚了。中文分词方法可以帮助判别英语单词的边界。其实，语言处理的许多数学方法通用的和具体的语�a�无关。在 Google 内，我们在设计语�a�处理的算法时�Q�都会考虑它是否能很容易地适用于各�U�自然语�a�。这��P��我们才能有效地支持上癄��语言的搜索�?br />
对中文分词有兴趣的读者，可以阅读以下文献�Q?br />
1. 梁南�?
书面汉语自动分词�pȝ��
http://www.touchwrite.com/demo/LiangNanyuan-JCIP-1987.pdf

2. 郭进
�l�计语言模型和汉语音字�{换的一些新�l�果
http://www.touchwrite.com/demo/GuoJin-JCIP-1993.pdf

3. 郭进
Critical Tokenization and its Properties
http://acl.ldc.upenn.edu/J/J97/J97-4004.pdf

4. 孙茂�?br /> Chinese word segmentation without using lexicon and hand-crafted training data
http://portal.acm.org/citation.cfm?coll=GUIDE&dl=GUIDE&id=980775

calvinlau 2009-05-27 00:04 发表评论

�Q��{�Q�数学之��?�p�d��一 -- �l�计语言模型

calvinlau — Tue, 26 May 2009 16:03:00 GMT

数学之美 �p�d��一 -- �l�计语言模型

http://googlechinablog.com/2006/04/blog-post.html

2006�q?�?�?上午 08:15:00
从本周开始，我们��定期刊�?Google �U�学家吴军写的《数学之��》系列文章，介绍数学在信息检索和自然语言处理中的��d��作用和奇妙应用�?/span>

发表�? 吴军, Google 研究�?

前言

�? 许大家不�怿��Q�数学是解决信息��索和自然语言处理的最好工兗��它能非常清晰地描述�q�些领域的实际问题�ƈ且给出漂亮的解决办法。每当�h们应用数学工兯��决一个语�a�问题�Ӟ��M��感叹数学之美。我们希望利�?Google 中文黑板报这块园圎ͼ�介绍一些数学工��P��以及我们是如何利用这些工��h��开�? Google 产品的�?br />
�p�d��一�Q?�l�计语言模型 (Statistical Language Models)

Google 的��命是整合全球的信息，所以我们一直致力于研究如何让机器对信息、语�a�做最好的理解和处理。长期以来，人类一直梦想着能让机器代替人来��译语言、识别语韟뀁认识文字（不论是印刷体或手写体�Q�和�q�行��量文献的自动检索，�q�就需要让机器理解语言。但是�h�cȝ��语言可以说是信息里最复杂最动态的一部分。�ؓ了解�? �q�个问题�Q��h们容易想到的办法��是让机器模拟�h�c�进行学�?- 学习人类的语法、分析语句等�{�。尤其是在乔姆斯基（Noam Chomsky 有史以来最伟大的语�a�学家�Q�提�?“形式语言” 以后�Q��h们更坚定了利用语法规则的办法�q�行文字处理的信��c��遗憄��是，几十�q�过��M��Q�在计算机处理语�a�领域�Q�基于这个语法规则的�Ҏ��几乎毫无�H�破�?

其实早在几十�q�前�Q�数学家��g��息论的祖师爷香农 (Claude Shannon)��提��Z��用数学的办法处理自然语言的想法。遗憄��是当时的计算机条件根本无法满��_��量信息处理的需要，所以他�q�个��x��当时�q�没有被��Z��重视。七十年代初�Q�有了大规模集成电�\的快速计��机后，香农的梦��x��得以实现�?br />
首先成功利用数学�Ҏ��解决自然语言处理问题的是语音和语�a�处理大师��N��克 (Fred Jelinek)。当时贾里尼克在 IBM 公司做学术休�?(Sabbatical Leave)�Q�领��g��一�Ҏ��出的�U�学家利用大型计��机来处理�h�c�语�a�问题。统计语�a�模型��是在那个时候提出的�?br />
�l�大家�D个例子：在很多涉及到自然语言处理的领域，如机器翻译、语韌��别、印刷体或手写体识别、拼写纠错、汉字输入和文献查询中，我们都需要知道一个文字序列是否能构成一个大家能理解的句子，昄��l��用者。对�q�个问题�Q�我们可以用一个简单的�l�计模型来解册��个问题�?br />
�? �?S 表示一�q�串特定��序排列的词 w1�Q?w2�Q?#8230;�Q?wn �Q�换句话��_��S 可以表示某一个由一�q�串特定��序排练的词而组成的一个有意义的句子。现在，机器对语�a�的识别从某种角度来说�Q�就是想知道S在文本中出现的可能性，也就是数学上所说的S 的概率用 P(S) 来表�C�。利用条件概率的公式�Q�S �q�个序列出现的概率等于每一个词出现的概率相乘，于是P(S) 可展开为：

P(S) = P(w1)P(w2|w1)P(w3| w1 w2)…P(wn|w1 w2…wn-1)

�? �?P (w1) 表示�W�一个词w1 出现的概率；P (w2|w1) 是在已知�W�一个词的前提下�Q�第二个词出现的概率�Q�以�ơ类推。不隄��出，��C��词wn�Q�它的出现概率取决于它前面所有词。从计算上来看，各种可能性太多，无法实现。因此我们假定�Q意一个词wi的出现概率只同它前面的词 wi-1 有关(即马��可夫假设）�Q�于是问题就变得很简单了。现在，S 出现的概率就变�ؓ�Q?br />
P(S) = P(w1)P(w2|w1)P(w3|w2)…P(wi|wi-1)…
(当然�Q�也可以假设一个词又前面N-1个词军_��Q�模型稍微复杂些。）

�? 下来的问题就是如何估�?P (wi|wi-1)。现在有了大量机��L��本后�Q�这个问题变得很��单，只要��C��数这对词�Q�wi-1,wi) 在统计的文本中出��C��多少�ơ，以及 wi-1 本��n在同��L��文本中前后相��d��C��多少�ơ，然后用两个数一除就可以�?P(wi|wi-1) = P(wi-1,wi)/ P (wi-1)�?br />
也许很多��Z��怿�用这么简单的数学模型能解军_��杂的语音识别、机器翻译等问题。其实不光是�思h�Q�就�q�很多语�a�学家都曾质疑�q�这�U�方法的有效性，但事实证明，�l�计语言模型比�Q何已知的借助某种规则的解��x��法都有效。比如在 Google �?a target="_blank" >中英文自动翻�?/a>中，用的最重要的就是这个统计语�a�模型。去�q�美国标准局(NIST) �Ҏ��有的机器��译�pȝ��q�行了评��，Google 的系�l�是不仅是全世界最好的�Q�而且高出所有基于规则的�pȝ��很多�?br />
�? 在，读者也许已�l�能感受到数学的��妙之处了，它把一些复杂的问题变得如此的简单。当�Ӟ��真正实现一个好的统计语�a�模型�q�有许多�l�节问题需要解冟뀂贾里尼�? 和他的同事的贡献在于提出了统计语�a�模型�Q�而且很漂亮地解决了所有的�l�节问题。十几年后，李开复用�l�计语言模型�?997 词语韌��别的问题��化成了一�?20 词的识别问题�Q�实��C��有史以来�W�一�ơ大词汇量非特定��l�语音的识别�?br />
我是一名科学研�I��h�?�Q�我在工作中�l�常惊叹于数学语�a�应用于解军_��际问题上时的��奇。我也希望把�q�种��奇讲解�l�大家听。当�Ӟ��归根�l�底�Q�不��什莫样的科学方法、无论多莫奇妙的解决手段都是��Z�h服务的。我希望 Google 多努力一分，用户��多一分搜索的喜悦�?

calvinlau 2009-05-27 00:03 发表评论

www.在线视频,性网站在线看,一本到av在线

整数转字�W�串

�Q�zz�Q?x&(x-1)表达式的意义

计算整数的二�q�制表示有多���个1

数组循环位移

判断数组中的重复元素

�Q��{�Q�数学之��?�p�d���?-- 谈谈中文分词

数学之美 �p�d���?-- 谈谈中文分词

�Q��{�Q�数学之��?�p�d��一 -- �l�计语言模型

数学之美 �p�d��一 -- �l�计语言模型

计算整数的二�q�制表示有多��个1

�Q��{�Q�数学之��?�p�d��?-- 谈谈中文分词

数学之美 �p�d��?-- 谈谈中文分词