语料库研究所成立于2008年10月22日,现任所长李良炎博士。随着计算机技术的高速发展,以语料库为平台进行语言理论及应用研究已经成为国内外的一种基本趋势。以重庆大学计算机技术优势为依托,为了打造基地的语言资源共享平台,通过与计算机学院有关专家联合成立语料库研究所。本所拥有计算语言学实验室,并与重庆大学计算机学院机器学习实验室共享资源与技术,具有良好的研究设备和条件。目前已经形成的研究特色和优势包括:
一、语料库语言学理论与技术研究:
主要研究语料库语言学的基本理论及其技术实现。针对语料库建设中句法标注与语义标注难题,依托人工智能、机器学习、数据挖掘等计算机前沿技术进行攻关,目前已经取得阶段性突破。代表性成果有:《信息依存句法标注模型》(专著,学林出版社,2008年)、“基于Tabu搜索的聚类算法研究”(计算机科学,2005年1期)等。
二、专门用途英语语类研究及语料库建设:
主要研究基于系统功能语法理论建立专门用途英语语类的理论框架,并对专门用途英语语类问题,尤其是学术英语语料库建设以及辅助学术写作软件开发进行深入研究。代表成果有:《中外TESOL期刊英语摘要语类对比研究及其运用》(专著,四川人民出版社,2007年)、“从语步结构与动词的及物性过程研究看中外语言学类期刊摘要中的语言”(《重庆大学学报》社科版,2007年8期)等。
三、自然语言处理技术研究:
主要研究自然处理技术,提出了基于词联接的自然语言处理技术,并在中国古典诗词语言处理系统中得到验证。该系统在中国古典诗词豪放与婉约风格机器测评,对联自动生成方面填补了相关领域的研究空白。代表成果有:《基于词联接的自然语言处理技术及其应用研究》(专著,学林出版社,2007年)、“SVM-based classification method for poetry style”(Proceedings of the Sixth International Conference on Machine Learning and Cybernetics,2007年,EI核心检索)等。