| 姓名:张普著 作者简介: 作品:《中华小百科全书:语言文字》《数字化汉语教学的研究与应用》《百年振铎》《动态语言知识更新研究》 |
| 第一部分 思考篇 关于大规模真实文本语料库的几点理论思考 一、关于语料库建设 我国的语料库建设始于20世纪80年代初期。那时的语料库叫语言资料库,建设的主要目的是为了给字词典的编纂提供例句或者给语言学家研究语言提供第一手资料。而信息处理领域的专家由于信息处理的需要,也差不多同时开始在计算机中建立语言资料库,用以自动获取语言统计知识,对语言进行计量研究。80年代中期,陆续有电子版的语言资料库及其统计成果投入使用,这种建立在计算机中的语言资料库简称语料库(corpus),它是大规模真实文本的有序集合,是利用计算机对语言进行各种分类、统计、检索、综合、比较等研究的基础,而“文本”(text)则是语言的符号串,文字信息的处理对象,是依据语言学的原则和数理统计的方法从自然语言中抽取出来的。根据研究的需要,所抽取的文本的长度有时是其自然长度,有时是定长的。在从相对无限的自然语言材料中抽取有限的文本时,有时是等密度的,有时是不等密度的。 …… 更多 |
| 序 前言 第一部分 思考篇 关于大规模真实文本语料库的几点理论思考 关于语感与流通度的思考 关于网络时代语言规划的思考 信息处理用语言知识动态更新的总体思考 关于汉语语料库的建设与发展问题的思考 第二部分 控制论篇 控制论与语言学的关系极其密切——主持人的话 关于控制论与动态语言知识更新的思考 关于种族信息量的测定与语感模拟 关于“约定俗成”的约定俗成 第三部分 理论篇 语言信息处理领域的一个新的命题——主持人的话 论历时中包含有共时与共时中包含有历时 关于动态语言知识更新与流通度问题 当前字、词、语量化研究的五个深化方向 第四部分 应用篇 1997中文报纸媒体流通度分析 流通度在it术语识别中的应用分析——关于术语、术语学、术语数据库的研究 基于dcc的流行语动态跟踪与辅助发现研究 “突发事件”专题解读——兼评“2004中国主流报纸十大流行语”发布 2005新增“教育类”“安全专题”“联合国专题”解读——兼评“2005春夏季中国主流报纸十大流行语” 字母词语的考察与研究问题 第五部分 附录篇 语言的意义及其获取 关于“监控语料库”的评述 古代汉语语料库建设 现代汉语语料库建设 汉语字频和词频研究 论多媒体技术在语言信息处理中的作用 语言的多媒体性与多媒体语言知识的作用 参考文献 后记 更多 |
商品评论(0条)