机器人会阅读得"自由" 成为生活中的好帮手(图)

2010年12月17日16:01 | 中国发展门户网 www.chinagate.cn | 给编辑写信 字号:T|T
关键词: 阅读能力 光学文字识别 机器人可 玛吉 银行 阿西莫 水军 用户 研究人员 基本系统

视频播放位置

下载安装Flash播放器

阅读能力很重要

对于人类来说,会识字就基本上算是会阅读了,因为人类对读出声来的本国文字,很容易明白文字所蕴含的含义。比如,当我们念出“银行”两个字的时候,就知道那里是进行存钱、取钱、汇款等金融活动的地方。然而,对于机器来说,识字是很容易的事情。只要安装一个语音软件,电脑就可以为我们朗读一篇文章。

然而,会认字只是阅读能力的第一步,更重要的是要理解所看到的字词的具体含义。但是,这对人类很简单的事情对机器人来说就很难了。当机器人看到“银行”二字时,它可以轻易地读出来,但是要让它理解“银行”的真正含义,并把所需完成的任务结合起来,则是一件难事。如果机器人能够正确地理解所看到的事物和标志,它就能够不需用户的帮助自由地活动了。

会阅读的机器人名为“玛吉”(Marge),是英国牛津大学和澳大利亚科技大学的研究人员联合开发的,其基本系统学习了日本的“阿西莫”机器人。在它体内的电脑里有一个强大的语言分析系统,可以帮助它认识在都市里所看到的一些标志,然后综合分析,发出行动指令。比如,用户需要机器人去某个商店打瓶酱油回来。机器人接到指令后,电脑中的GPS开始安排路线,机器人按照路线行动,但是它必须要认识路线上的标志,知道该在哪里转弯,在哪里上下台阶,找到商店后对售货员说:“给我来瓶酱油。”并出示主人的信用卡结账。如果是在超市购物,机器人可以根据超市的分类标志找到调料专柜,然后找到用户需要的品牌。如果它没有阅读能力,要完成这些任务是不可能的。

机器人如何进行阅读

机器人如何进行阅读呢?其原理和人们进行阅读一样。当我们在街上看到某个标牌时,这个标牌在我们视网膜上会形成一个影像,然后通过视神经传递到大脑,我们掌管阅读的神经区域就能够认识它,并分析它的意义。对于“玛吉”来说,这个过程会稍微复杂一些。它首先会把看到的标牌拍成照片输送到电脑中,电脑中的光学文字识别系统(OCR)需要先把图像中的文字识别出来,并转化为文本,然后再分析这些文本的含义。

机器人体内的光学文字识别系统有时也会出错,把图像中的字母转换错了。这样出来的英文单词就出现了拼写错误,机器人就不知道所看到的标牌究竟是什么意思了。此时,机器人可以向用户求助,通过无线网络系统把图像传输到用户的手机上,用户再根据所看到的图像拼写出正确的单词,把这个单词发回给机器人,机器人又能正确地前行了。当然,随着识别系统的不断完善,机器人麻烦用户的次数会越来越少。

阅读机器人抢险救灾

当然,自由活动机器人除了需要阅读能力外,一些基本的户外活动能力也是必需的,比如它需要知道走人行道,需要识别障碍物,不至于被障碍物绊倒,也不会和其他行人相撞。它还要学会识别红绿灯,知道绿灯行、红灯停。即使在绿灯的时候,它还要学会避让快速穿过的警车、救护车和消防车。研究人员表示:“开始的时候,玛吉会显得很笨拙,它们在外面活动经常会出现各种意想不到的意外状况,比如看到公路维修标志也不知道正确反应,结果掉进修路的沟里。”

研究人员会不断完善“玛吉”的阅读系统,它也会在户外活动中不断学习和进步。英国牛津大学机器人专家伊格玛·珀斯恩称,这种可以阅读的机器人是机器人研究领域一项重大突破,有时通过阅读一间封闭房间上的标签能够进一步发现房间内有什么,阅读能力可以帮助机器人探寻到无法直接看到的事物。除了会识别一些路牌外,目前“玛吉”甚至会阅读一些开云网页版-开云(中国)官方在线登录网站上的开云网页版-开云(中国)官方在线登录,并能部分理解相关的内容和信息。在将来,你看到的网络发帖者很可能就是一台机器人呢,那些网络“水军”可能就会面临失业的威胁了。

阅读机器人将来的一个重要用途是帮助人们完成购物和送快递等跑腿的工作,它要比人的信任度高得多,至少它不会偷看你的邮件,或是吞没你的贵重物品。还有一个重要的用途是抢险救灾,如果没有阅读能力,它在火灾中不知道该进入哪个楼层哪个房间。比如,消防人员发现8楼302房间有人被困,不会阅读的机器人就很难理解被困人究竟在哪里,而阅读机器人则可以顺利地找到房间。相信随着阅读机器人的不断进化,未来的机器人将成为我们生活中的好帮手。

   上一页   1   2  


返回顶部文章来源: 新民晚报