第254章 前所未有的高度
而天分之外给伊芙·卡莉留下最深刻印象的又是林灰的举止儒雅、待人宽厚。
接触的时间久了之后,当对林灰的天分和待人随和了然之后。
给伊芙·卡莉留下更深刻的印象反而是林灰渊博的学识和灵动的思维。
具体伊芙·卡莉也不知道该怎么回答这一问题。
对于这类的问题伊芙·卡莉干脆统一回复为:
——LIN HUI是个理性且令人着迷的人。
事实如此,林灰极其理性的逻辑、沉静的气质、对待事物专注的态度这些都让伊芙·卡莉着迷。
甚至于伊芙·卡莉心底深处似乎还生出了几分沉寂已久的别样情愫。
一个能够举手投足间悄无声息影响世界又怎么能不让人着迷呢?
甚至不只是影响世界,实际上林灰的一些举动已经产生很多深远的影响了。
或许林灰自己还没意识到他在改变世界。
但事实是林灰已经在改变世界了。
伊芙·卡莉对此却是再清楚不过了。
首先,林灰在文本摘要方面的贡献太大了。
而文本摘要本就是可以影响世界的。
这并不是夸张的说法。
涉及到文本摘要方面的研究其实有很长的历史了。
东方对于文本摘要的研究是什么状况此前伊芙·卡莉不是很清楚。
但来到中國之后,伊芙·卡莉通过一些麻省理工学院同中國友好合作的机构才了解到。
广泛意义上的文本摘要这方面中國虽然似乎没啥项目。
但涉及到纯粹的中文文本处理这个古老的东方国度不但有专门的项目。
甚至于有的还被863计划这样的国家级计划所涵盖。
863计划,顾名思义自然是在86年3月开始执行的。
当时第一次听说不少涉及到文本摘要的项目甚至于早在上世纪末期就开始了。
伊芙·卡莉是震撼的。
甚至细思之下,伊芙·卡莉觉得比较恐怖。
都已经是2014年了,居然还有一个近乎于三十年前开始的计划在按部就班地向前推进。
做计划不难,难的是计划的执行力度。
就这份三十年前确定的计划的执行力度可以说世界范围内也是没谁了。
总之伊芙·卡莉觉得这在频繁两挡交替的美國几乎是难以想象的事情。
不过仅仅是文本摘要这方面。
伊芙·卡莉还不至于太悲观。
毕竟西方在文本摘要这方面一样是倾注了大量心血。
甚至于要远比华国在这方面开始的研究还早。
伊芙·卡莉记得此前还在学生时代的时候就听闻西方关于文本摘要这方面的研究在冷/战初期就已经开始了。
最早进行这方面工作的是诸如斯坦福大学、麻省理工学院之类的这些学校。
不过当时这些学校背后的雇主是美國的五/角/大楼。
听起来很奇怪,但并不奇怪。
事实如此,现在人类互联网以及计算机方面各种各样的技术最初都和军方有着千丝万缕的联系。
甚至于不少技术几乎就是纯粹的军转民。
涉及到文本摘要这个方向。
之所以当初当时进行文本摘要这方面的研究是旨在通过在文本摘要上实现技术突破从而能够更加高效地通过一些诸如新闻、报道各种公开的资料进行信息处理,同时进行文本摘要方面的研究也是为了能更好的实现对敌对势力的舆情分析。
至于是什么敌对势力,自然是昔年无比强大的北极熊。
说起来这也是早期文本摘要编码的一个奇葩特征。
对中文这门使用人数相当多的语言基本没啥处理能力。
对俄文处理却几乎拥有和英文同等水平的高效性。
不管最初的目的是什么。
总之,在相当长的一段时间里涉及到文本摘要这方面的研究都相当受重视。
甚至在相当长的一段历史时期该领域的部分研究经费甚至直接是来自M國军费中的拨款。
后来随着间谍卫星等更高效获取情报的手段相继问世,M军方对这方面的研究的热情才逐渐被淡漠。
尽管如此,商业上对文本摘要的热情却几乎自始至终毫无动摇。
文本作为信息的重要载体,再怎么重视也不为过。
新世纪互联网的告诉发展,大量信息的涌现。
人们更是不得不重视。
对信息的研究越深入,我们就越能了解到这个世界。
文本摘要的深度探索,让我们对信息的掌控更强。
就林灰在文本摘要上所作的贡献而言。
说林灰改变了世界也不为过。
反正伊芙·卡莉不觉得这种说法有什么不对的地方。
涉及到具体领域,林灰所作的贡献在自然语言处理所做的贡献实在是同样很大。
相对于传统的抽取式文本摘要,生成式文本摘要的意义空前。
之所以说生成式文本摘要的意义空前,并不仅仅是因为这项技术在处理文本摘要上效率上更高。
当然生成式文本摘要能够拥有更高的处理文本的效率。
这个对于记者之类的相关使用人员来说效率的提高确实是很具有意义。
但这不是科研人员所关心的。
一个转动的更快的轮子相比于一个同样能转但转的较慢的轮子相比有价值。
但深究之下会发现其实价值也不大。
事实上伊芙·卡莉觉得生成式文本摘要最不起眼的内容就是其在效率方面的提升。
甚至可以说效率只是生成式文本摘要这项算法的外在表现而不是这一算法的真正内核。
通常意义上所说的自然语言处理(NLP)主要内容无非就是两部分。
一部分是NLU,另一部分是NLG。
前者指的是自然语言理解,后者指的是自然语言生成。
林灰搞定的生成式文本摘要算法在自然语言理解和自然语言生成此二者上都有极为突出的意义。
生成式文本摘要这项全新的文本摘要算法。
其相比于传统的抽取式摘要只能借助于原有的文本内容抽取而言,能直接“无中生有”的进行摘要生成。
这样的一种算法在自然语言理解方面自然是做到了前所未有的高度。
而且这也启发着在自然语言生成方面有可能实现新的突破。
本章已完成!