12月1日上午,厦门大学博士生导师史晓东教授在和义楼五楼会议室作了题为“异体字词典介绍”的学术报告。BET体育365投注官网部分师生聆听了报告。
报告中,史晓东给出了异体字的定义,强调了研究和处理异体字的必要性,介绍了目前异体字词典的编纂情况和异体字词典的应用场景。他认为,信息检索绕不开处理异体字问题,语义计算更离不开异体字的处理,若以图片为字,则无法进行检索。史晓东提出“先有异体词,然后才有异体字”的观点,认为异体字处理过程中先词再字,不但容易操作,而且对字义的理解更加准确。史晓东介绍,同传统的异体字词典编纂方法不同,他们团队基于大数据和人工智能新技术研究了异体字词典的自动编纂方法,不仅大大提高了编纂效率,而且成功识别了现有词典未收录的7000多个异体字。
报告结束后,史晓东同现场师生就异体字的检索、深度学习在异体字识别中的应用、异体字编码等问题进行了热烈讨论。
史晓东,教授,博士,博士生导师。厦门大学人工智能研究所所长、智能科学系副主任、类脑计算技术及应用福建省重点实验室常务副主任、语言技术中心第一研究室主任,兼任中国中文信息学会常务理事、福建省计算机学会理事、中国计算机学会中文信息技术专业委员会委员、中文信息学报编委。主要研究领域为自然语言处理、机器翻译,是国内机器翻译方面的专家。