机器人自然语言处理
2021-12-27 阅读量:160 来源:机智网

  复杂的语言交流是人区别于其他动物的特征,也是人类智能的重要表现。让机器用人类的语言与我们交流,可以大大降低我们使用机器的难度,提升效率。

  让计算机用人类的语言交流的人工智能技术称为自然语言处理。它是一门融合语言、翻译、计算机、数学、声学等的交叉学科。如果让计算机与人进行语言交流,需要三个步骤,分别是“听见”、“理解”和“说话”。其中理解语言是最困难的。

  一、将语音转化为文字

  当你用汉语说出一句“我是机器人”时,计算机“听到”的是一段声波信号。计算机先要把这段声波中收尾的噪声切除,以降低对后续步骤造成的干扰。然后再把声波割成很多小段,目的是捕捉能分辨细微差别的声音特征。每小段长度一般为0.02~0.03 秒。随后计算机对这些语音片段进行运算,识别出构成字词发音的最小单位“音素”。这时要用到和汉语发音有关的大量知识(即声学模型),例如“我”字的发音是“wǒ”,包含两个音素,分别是“w ”和“o”。声学模型告诉计算机什么样的声波特征最有可能是说话人在发“w”这个音,什么样的声波特征最有可能是说话人在发“o”这个音。当计算机从声波特征里分析出“wo”时,就能判断出一个字的读音了。

  虽然知道了读音,但这并不意味着就知道具体是哪个字,因此计算机要把音素拼接起来识别字、词。通常在一句话的上下文中更容易理解一个发音对应哪个字、词。我们小学做的组词、造句练习就有这个作用。当你单独发“jī”时,别人不知道你说的是“机”、“鸡”还是“基”,但如果你说“jī qì ,则大部分听说过“机器人”这个词的人就能理解你说的是“机”字。这个看似十分简单的“听力题”需要十分熟悉汉语语言的特点、认识足够多的字和词,还要有一定的生活常识及了解中国汉字文化的基础。

  二、理解文字的意思(语义)

  理解了字、词就能听懂一句话了吗?仍然不能。“我是机器人”说明了“我”和“机器人”的关系,而“我打机器人”说的是“我”对“机器人”做的动作。因此,计算机还要会分析句子的语法才能真正理解一句话里各个字、词之间的关系。这样,当听到“我是机器人”时,计算机才会回答“我也是”,而如果它听到的是“我打机器人”,同时会做出逃跑的动作或者讥笑你“你打得过我们吗”?更困难的是语言本身存在着各种歧义性和多义性。一个词语、一段话在不同的语境中可以有完全不同的意思。

  我们看看下面这两句话 :

  “给猩猩吃香蕉,因为它们饿了。”“给猩猩吃香蕉,因为它们成熟了。”

  在这里出现的两个“它们”,人类可以轻易地区分出第一个“它们”指的是猩猩,第二个“它们”指的是香蕉。而如果想让人工智能理解这两句话,需要根据上下文进行推理,消除歧义。

  因此,为了获得能听懂汉语的人工智能,还需要通过“语言模型”“词典模型”以及计算机汉语字、词、句子等的特点,计算机根据这些模型进行推理运算并配合大量的语言训练,才能理解语言。通过这样一个复杂曲折的过程,“我是机器人”这句话最终被分解成了“我”“是”“机器人”三个词,而且还确定了“我”是主语,“是”是谓语,“机器人”是宾语。这样,人工智能才能真正“理解”这句话。

  从表面理解,视觉和听觉似乎是完全不同的感官,但是大脑对它们的识别方式却有很多相似之处。事实上,在自然语言处理的过程中也大量运用了视觉识别的人工神经网络技术。

企业入驻
400-030-8988

客服微信

意见反馈
回到顶部