English | 中文

English | 中文

国际会议专栏:袁家宏博士特邀报告 | “一带一路”语言资源与智能国际学术研讨会
作者:
2017年07月27日

嘉宾简介

袁家宏,男,语言学博士。1991年至1992年就读于北京大学力学系,1992年至1998年就读于北京大学中文系,1998年至2004年就读于康乃尔大学语言学系。2004年至2005年在斯坦福大学从事博士后研究;2005年至2012年任宾西法尼亚大学语言学系助理教授,语音学实验室主任;2012年至今任宾西法尼亚大学语言资源联盟副主任,主管语音研究。袁家宏的主要研究方向是语料库语音学,语音韵律,以及语音技术在语音学研究中的应用,曾主持包括美国国家科学基金(NSF)和英国经济和社会研究理事会(ESRC)等的多项科研项目。袁家宏积极倡导和推进大数据语音学,其开发的语音强制对齐软件被广泛应用于语音学,心理学以及社会语言学等研究领域。

报告题目:大规模语音语料库的采集、处理和研究

发言摘要

语言资源保护的核心问题之一是如何对语言资源进行存档。从纸笔调查到建立有声数据库,传统的语言资源存档对语言材料的采集具有很强的系统性和针对性。计算机技术和大数据的发展则为语言资源保护提供了另外一个思路,那就是利用海量的语言材料对语言的真实面貌进行全景存档。在这一新的思路中,语言材料的采集、处理和研究可以是分离的,由不同的人在不同的时间实施并共享。本文以汉语普通话为例,阐述大规模语音语料库的采集、处理和研究中的问题和方法,希望对语言资源保护工作能有所启发。