当前位置: 首页 >> 通知公告 >> 科研成果 >> 正文

荀恩东|语言智能核心:语义理解 CCF GAIR2020 人工智能与机器人峰会

发布者: [发表时间]:2020-11-10 [来源]: [浏览次数]:

    2020 年 8 月 7 日,由中国计算机学会 CCF 主办,雷锋网和香港中文大学(深圳)联合承办,鹏城实验室和深圳市人工智能与机器人研究院协办的 CCF-GAIR 2020 全球人工智能与机器人峰会,在深圳开幕。多位学界业界大咖登临 AI 前沿专场和纪念 Thomas S. Huang 圆桌论坛,奉献一场思想的盛宴。北京语言大学荀恩东教授从语义理解角度出发,为我们带来精彩的学术报告。
    荀恩东教授先后在微软亚洲研究院,香港科技大学工作,研究领域为自然语言处理;他的主要研究内容为汉语语义计算和语言资源建设,主持开发的 BCC 语料库,是国内外最大的在线语料库,为语言研究和开发的首选语料库。他提出了用于汉语语义分析的意合图理论和构建方法,带领团队揭榜工信部人工智能重大攻关任务,在多个领域开展汉语语义理解落地应用工作。
    在大会上,荀恩东教授带来了非常精彩的大会报告,报告主题为《语言智能核心问题——语义理解》。
荀恩东教授表示,语音智能之所以那么难,是自然语言的特点决定的,毕竟自然语言的歧义无处不在;其中歧义包括语义、词法、语法、语意、语用等方面的内容,而且还涉及到语言多样性,并且面临着知识瓶颈。
    基于这个毕竟,荀恩东教授提到了语言智能的四类应用,分别是分类、生成、抽取,校对。他表示,语义理解是语言智能的主要任务,这涉及到理解的目标、途径和主要的模型。
他表示:实际上,在处理语言时,所谓的理解就是确定了概念与语言单元的映射,以及知道承载概念单元的语言属性,并且知晓了不同语言单元之间的关系。语言单元在不同的场景里面有不同的表现,有的可能就是简单的词和词之间的关系,词的属性,有的可能是涉及到句子和句子之间的关系,段落和段落等。
    荀恩东教授还表示,语言关系在数学上可以表现为序列的关系、几何关系、数的形态和图的形态,复杂的问题是这些形态的组合;所以做语言理解实际上就是把自然语言做结构化,这种结构化是计算机可操作的一个结构化的方案,这种结构化的方案很容易对接落地的需求。