第46章(4/4)
顾文宇睁开眼,微微侧过头看蔡杨:“你是学自然语言转换的,对吗?”
“是啊。”蔡杨被问得一头雾水,倒是不明白顾文宇怎么突然提起这个。
蔡杨虽然是计算机专业,但对自然语言转换这方面却一直有着某种类似于天赋的灵性。所谓自然语言转换,也就是将人类的语言转换为计算机能够识别的语言。
可以说人类对于计算机的使用完全离不开自然语言转换技术。比如当你对计算机输入一串中文:中国的首都在哪里,首先需要将这句话转换成计算机可以读懂的代码,再从用代码中调取答案,然后再次转化成人类语言,最后就得到了结果:北京。
当然这属于自然语言转换中最基础最简单的部分。
若是再复杂一些,应用到互联网中的搜索引擎,假如你输入:中国的首都是哪里。程序员需要设计出一套算法,首先对你输入的查询串进行分词,分词后就是:中国/的/首都/是哪里。然后会提取一些比较重要的关键字,比如中国和首都,最后在之前已经抓取的网页里进行关键字匹配,选出相关性最高的网页排序展现给你。
“那你觉得,现在自然语言转换的最高水平是什么?”顾文宇又问。
“最高水平?应该是那种可以自动回答问题的吧……”蔡杨皱着眉想了想,“比如清华机器人小图?其实语音识别也属于很好高级的自然语言转换技术了,这几年已经相当成熟。再者……应该就是现在被炒得火热的苹果4S中的siri技术了,不仅可以识别人类语言,还能打破惯有的语法限制,直接以聊天的口语化形式与机主对话。但siri技术属于多种技术综合的成果,还涉及到云计算什么的……不过,在语言转换方面应该是最高水平了。”