Weibo Sentiment Analysis
|
15:30-15:45 |
|
15:45-15:55 |
LTLAB中文微博情感分析评测报告
周霄,周振宇,李芳;上海交通大学
显示摘要show abstract
隐藏摘要hide abstract
本文介绍了上海交通大学中德语言技术联合实验室(LTLAB)参加2012年中文微博情感分析评测的方法实现。在本届评测设立的3个评测任务中,LTLAB分别参加了任务1(观点句识别)和任务3(情感要素抽取):对于任务1,参评系统使用了基于分类器的方案,特征抽取时考虑到了文本中的词性和句法特征;对于任务3,参评系统结合了基于模板的抽取和基于分类器的抽取,考虑到了微博特有的话题信息以及词的统计信息。评测结果表明,本文提出的方法在实践中是行之有效的。
|
15:55-16:05 |
BUAA-SA: NLP&CC 2012中文微博情感分析评测报告
巢文涵;北京航空航天大学
显示摘要show abstract
隐藏摘要hide abstract
本文介绍了我们参与NLP&CC 2012中文微博情感分析评测的系统BUAA-SA,这是一个规则与统计相结合的情感分析系统,其中包括了观点句识别、情感倾向判断及情感要素提取等功能。考虑到微博属于短文本数据,系统基于搜索引擎对话题的情感词、情感对象进行了扩展。本文将首先介绍系统的基本组成,然后介绍系统参与NLP&CC 2012中文微博情感分析各任务的评测情况。
|
16:05-16:15 |
基于CRF和句法分析的中文微博情感分析
刘功申;上海交通大学
显示摘要show abstract
隐藏摘要hide abstract
上海交通大学信息内容技术国家工程实验室参加了2012年CCF自然语言处理中文微博情感分析测评。在本次微博情感分析测评中,分别采用两种算法,提交了两组结果。第一种方法是采用条件随机场算法,对微博信息进行情感预测。第二种算法是,利用Standford Parser进行句法分析,然后,根据句子成分之间的修辞关系计算句子的情感。经过主办方的公开测试,两组算法的结果优异。
|
16:15-16:25 |
基于监督学习方法的中文微博情感分析
施寒潇;浙江工商大学
显示摘要show abstract
隐藏摘要hide abstract
基于中文微博的情感分析无论是对舆情监督、个性化推荐,还是对社会计算的研究都有着重要意义,本次评测任务包括判断微博是否为观点句、分析微博情感倾向以及提取微博情感要素。在任务实现上,首先对大会提供的样本微博语料进行人工标注,并根据中文微博文本的特点,扩充现有的情感词典,引入具有情感倾向的网络用语;其次针对每个评测任务仔细分析和研究,分别构建不同的特征集;最后利用支持向量机(SVM)和条件随机场(CRF)对已标注的语料进行选择性训练,生成多个的模型。通过对部分数据的预测结果对比,选择最好的模型完成这次评测任务。
|
16:25-16:35 |
话题型微博语言特点及其情感分析策略研究
候敏;中国传媒大学
显示摘要show abstract
隐藏摘要hide abstract
微博已经成为现代人们传递态度、意见和评价的重要形式。本文以语言主观性为理论依据,分析了话题型微博语言句子简短、负面倾向居多、情感表达强烈而理性评价淡化、口语色彩浓重、观点表达的隐晦和非直接、评价对象省略、非规范性等语言特点,并就此提出基于短语情感词典及语义规则的观点句识别及评价对象提取的策略。实验和评测结果证明,这些策略和方法取得了较好的效果。
|
16:35-16:45 |
基于依存分析的中文微博情感分析研究
孙艳,周学广,李中远;海军工程大学
显示摘要show abstract
隐藏摘要hide abstract
有效地管理和使用微博评论信息是当前的迫切需求。在依存分析的基础上对中文微博进行了情感分析,参加了NLP&CC2012中文微博情感分析评测中的所有3个任务。总结了新词出现的原因,通过对成词的规则制定和串频统计等,提出一种基于规则和统计的新词识别算法。通过对现有情感词库的整合,构建了自己的情感词库。对情感词和评价对象的依存模式进行了分析,总结出6种评价单元模式,结合依存树的剪枝和归并策略,提出了基于依存分析的观点句识别方法和基于依存分析的情感要素抽取方法。在任务3的情感要素抽取评测中成绩排名第3,效果理想。
|
Chinese Word Semantics
|
17:05-17:20 |
|
17:20-17:30 |
中文同义词自动抽取研究
孙玉霞,狄颖,曹冉,孙玉杰,周俊生,曲维光; 南京师范大学
显示摘要show abstract
隐藏摘要hide abstract
本文对中同义词自动抽取的多种方法进行了研究,充分利用现有字典资源和网络百科知识。使用同义词林和中文概念典进行字方法研究;基于百度科,使用了模式匹模式匹配和并列结构的方法。基于模式匹配的方法在少量手动获取模式的基础上,从百科资源中自动获取上下文模式,从而实现同义词获取和自扩展。同时提出了基于并列结构的同义词自动抽取方法,采用基于词素的过滤和基于知网的过滤方法进行过滤,大大提高同义词抽取性能。实验结果表明,多种方法的综合使用,使得本文中的中文同义词自动抽取性能大幅度提高,并且适用于多种此类的同义词获取。
|
17:30-17:40 |
面向开放异构知识库的词汇同义关系学习
刘燚灵,吉阳生,顾翀†,崔首领,贾江涛;华为
显示摘要show abstract
隐藏摘要hide abstract
词汇同义关系识别在文本信息管理、信息检索和自然语言处理等领域中扮演重要作用。识别词汇同义关系的方法主要有两类:基于结构化知识库的匹配方法和基于在线/离线语料库的统计学习方法。基于知识库的方法对词汇关系的整理需要很高的专业技能和昂贵的时间开销。基于语料库的统计方法从大规模的文本语料中学习词汇同义关系,但是其习得的语义关系准确性尚不能令人满意。面向来自因特网的开放异构知识库,本文提出一种从其中提取同义关系的统计方法,可以进一步扩展和补充结构化同义词典知识库;在取得较高准确性的同时,提高词典知识库的同义关系覆盖率。在CCF的开放性语义关系评测中,本文提出的方法取得了宏平均F1值第三名和微平均F1值第二名的成绩。
|
17:40-17:50 |
基于网络资源的词语语义关系自动获取
刘江鸣,徐金安,吴培昊,张玉洁;北京交通大学
显示摘要show abstract
隐藏摘要hide abstract
针对中文词语语义关系自动获取的问题,提出了一种基于维基百科和百度百科等网络资源的同义及上下位语义关系的获取方案;实验结果显示,提出的语义关系获取方案,在同义关系和上下位关系自动识别中达到很好的效果。上下位关系自动识别宏平均达到0.4185,微平均达到0.5596。
|
17:50-18:00 |
基于词典和Web的词汇关系抽取
范庆虎,昝红英,张坤丽,贾玉祥;郑州大学
显示摘要show abstract
隐藏摘要hide abstract
郑州大学参加了NLP&&CC2012中的词汇语义关系的任务,该任务包括两个子任务,子任务1是同义词抽取,采用中文概念词典、同义词词林等词典并且结合百度百科、有道翻译等Web方式进行抽取,子任务2是下位词抽取,采用中文概念词典并且结合百度百科标签、互动百科、维基百科等Web方式进行抽取。两个子任务均采用词典和基于Web的方法。其中子任务1提交的结果宏平均F1值取得了第二名,微平均F1值取得了第三名;任务2提交的结果宏平均F1值取得了第一名,微平均F1值取得了第二名,子任务1和子任务2的所有召回率均取得了第一名。
|