NLP&CC 2013大会详细日程
周日,2013年11月17日(Sunday, Nov 17, 2013) | ||||
10:00–20:30 | 君豪一楼大堂: 注册(Registration) | |||
17:00–20:00 | 大宴会厅: 自助晚餐(Dinner) | |||
19:00–21:30 | 君豪-豪景厅: TCCI工作会议(TCCI Business Meeting) | |||
周一,2013年11月18日(Monday, Nov 18, 2013) | ||||
07:30–08:45 | 君豪一楼大堂: 注册(Registration) | |||
08:30–08:50 | 君豪-大宴会厅: 开幕(Opening) | |||
08:50–09:50 | 特邀报告:马维英博士,知识挖掘和语义搜索 Invited Talk by Dr. Weiying MA, Knowledge Mining and Semantic Search |
|||
君豪-大宴会厅 | ||||
Session Chair: 赵东岩 | ||||
09:50–10:05 | 君豪大饭店大门: 合影(Group Photo) | |||
10:05–10:20 | 君豪-大宴会厅: 茶歇(Coffee/Tea Break) | |||
10:20–11:20 | 特邀报告:黄昌宁教授,国内中文树库需加强谓词-论元结构描写 Invited Talk by Dr. Changning HUANG, Domestic Chinese Treebanks Need to Strengthen the Predicate-Argument Structure Description |
|||
君豪-大宴会厅 | ||||
Session Chair: 周明 | ||||
11:20–12:20 | 君豪-大宴会厅: Best Papers | |||
12:20–14:00 | 君豪负一楼自助餐厅: 午餐(Lunch) | |||
14:00–15:20 | 君豪-大宴会厅 | 君豪-豪景厅 | 君豪-豪信厅 | 君豪-豪仕厅 |
Fundamentals 1 | Machine Translation 1 | Evaluation Workshop 1 | Open Fund & Expo | |
15:20–15:50 | 茶歇(Coffee/Tea Break) | |||
15:50–17:10 | 君豪-大宴会厅 | 君豪-豪景厅 | 君豪-豪信厅 | 君豪-豪仕厅 |
Machine Learning for NLP | Information Retrieval | Evaluation Workshop 2 | Open Fund & Expo | |
18:30–20:30 | 君豪-大宴会厅: Poster/Demo Presentations and Banquet, Innovation Demo 技术成果展示) | |||
周二,2013年11月19日(Tuesday, Nov 19, 2013) | ||||
08:30–09:30 | 特邀报告:朱晓瑾,社交媒体转换为知识的数学模型 Invited Talk by Dr. Xiaojin ZHU, Some Mathematical Models to Turn Social Media into Knowledge |
|||
君豪-大宴会厅 | ||||
Session Chair: 周国栋 | ||||
09:30–10:30 | 特邀报告:张民,基于文档和篇章结构的机器翻译 Invited Talk by Dr. Min ZHANG, Document and Discourse-based Machine Translation |
|||
君豪-大宴会厅 | ||||
Session Chair: 李涓子 | ||||
10:30–10:50 | 君豪-大宴会厅: 茶歇(Coffee/Tea Break) | |||
10:50–12:20 | Panel:大数据:NLP的机遇和挑战 Big Data: Opportunities and Challenges for NLP |
|||
君豪-大宴会厅 | ||||
Moderator 论坛主席: 宗成庆 | ||||
12:20–14:00 | 君豪-负一楼自助餐厅: 午餐(Lunch) | |||
14:00–15:20 | 君豪-豪景厅 | 君豪-豪信厅 | 君豪-豪仕厅 | 重庆大学主教学楼114 |
CIT Applications 1 | Machine Translation 2 | Fundamentals 2 | NLP&CC校园开放日 | |
15:20–15:50 | 茶歇(Coffee/Tea Break) | |||
15:50–17:10 | 君豪-豪景厅 | 君豪-豪信厅 | 君豪-豪仕厅 | 重庆大学主教学楼114 |
NLP for Social Networks | Web Mining & QA | CIT Applications 2 | NLP&CC校园开放日 |
详细安排
Best Paper 返回 时间:2013年11月18日上午(11:20–12:20); 君豪-大宴会厅; Chair:周明 |
|
11:20-11:50 |
Text Window Denoising Autoencoder: Building Deep Architecture for Chinese Word Segmentation
|
11:50-12:20 |
Understanding Temporal Intent of User Query based on Time-based Query Classification
|
Fundamentals 1 返回 时间:2013年11月18日下午(14:00–15:20); 君豪-大宴会厅; Chair:余正涛 |
|
14:00-14:20 |
Sentence Compression Based on ILP Decoding Method
|
14:20-14:40 |
Exploring Multiple Chinese Word Segmentation Results Based on Linear Model
|
14:40-15:00 |
Chinese Argument Extraction Based on Trigger Mapping
|
15:00-15:20 |
基于推理线索构建的事件关系识别方法
|
Machine Translation 1 返回 时间:2013年11月18日下午(14:00–15:20); 君豪-豪景厅; Chair:史晓东 |
|
14:00-14:20 |
A Simple, Fast Strategy for Weighted Alignment Hypergraph
|
14:20-14:40 |
An Efficient Framework to Extract Parallel Units from Comparable Data
|
14:40-15:00 |
Collective Corpus Weighting and Phrase Scoring for SMT using Graph-based Random Walk
|
15:00-15:20 |
基于翻译日志的统计机器翻译模型剪枝
|
Evaluation Workshop 1 返回 时间:2013年11月18日下午(14:00–15:20); 君豪-豪信厅; Chair:万小军 |
|
14:00-14:15 |
Linking Entities in Short Texts based on a Chinese Semantic Knowledge Base
|
14:15-14:30 |
语义特征在评价对象抽取与极性判定中的作用
|
14:30-14:45 |
基于情绪因子的中文微博情绪识别与分类
|
14:45-15:00 |
A Mixed Model for Cross Lingual Opinion Analysis
|
15:00-15:15 |
Entity Linking from Microblogs to Knowledge Base Using ListNet Algorithm
|
Open Fund & Expo 返回 时间:2013年11月18日下午(14:00 -17:10); 君豪-豪仕厅; Chair:赵东岩,汤帜 |
|
14:00-17:10 |
开放课题:CCF2012-01-03,试题编辑控件开发方法研究(杨绪兵)) 开放课题:CCF2012-01-05,汉字字形计算的云服务平台(杨玉星) 开放课题:CCF2012-01-06,汉字字形的美观度评价(李伟) 开放课题:CCF2012-02-01,西夏文原始字形整理及语料库建设(柳长青) 开放课题:CCF2012-02-01,藏文自动校对方法研究(珠杰) 开放课题:CCF2012-02-02,基于关键词优化的LDA模型分析中文科技文献中的研究热点和趋势(李保利) |
Machine Learning for NLP 返回 时间:2013年11月18日下午(15:50–17:10); 君豪-大宴会厅; Chair:林鸿飞 |
|
15:50-16:10 |
Semi-supervised Text Categorization by Considering Sufficiency and Diversity
|
16:10-16:30 |
Incorporating Entities in News Topic Modeling
|
16:30-16:50 |
基于Deep Learning的代词指代消解
|
16:50-17:10 |
Discriminative Latent Variable Based Classifier for Translation Error Detection
|
Information Retrieval 返回 时间:2013年11月18日下午(15:50–17:10); 君豪-豪景厅; Chair:马军 |
|
15:50-16:15 |
Improve Web Search Diversification with Intent Subtopic Mining
|
16:15-16:40 |
基于本体结构的新闻个性化推荐
|
16:40-17:10 |
A Fast Matching Method Based on Semantic Similarity for Short Texts
|
Evaluation Workshop 2 返回 时间:2013年11月18日下午(15:50–17:10); 君豪-豪信厅; Chair:冯岩松 |
|
15:50 -- 16:10 |
评测任务总体介绍
|
16:10 -- 16:25 |
中文微博观点要素抽取研究
|
16:25 -- 16:40 |
中文微博实体链接研究
|
16:40 -- 16:55 |
基于向量空间模型的中文微博实体链接
|
16:55 -- 17:10 |
微博实体与百科条目链接的多策略研究
|
Poster/Demo Presentations and Banquet 返回 时间:2013年11月18日晚上(18:30-20:30); 君豪-大宴会厅; Chair:万小军 |
|
18:30-20:30 |
Poster 1: Grey Relational Analysis for Query Expansion
|
18:30-20:30 |
Poster 2: 中文微博实体链接研究
|
18:30-20:30 |
Poster 3: 基于互联网的术语定义辨析
|
18:30-20:30 |
Poster 4: 维吾尔语大词汇语音识别系统识别单元研究
|
18:30-20:30 |
Poster 5: Feature Analysis in Microblog Retrieval Based on Learning to Rank
|
18:30-20:30 |
Poster 6: Opinion Sentence Extraction and Sentiment Analysis for Chinese Microblogs
|
18:30-20:30 |
Poster 7: 基于清华树库的复句关系词识别与分类研究
|
18:30-20:30 |
Poster 8: A Time-Sensitive Model For Microblog Retrieval
|
18:30-20:30 |
Poster 9: 基于最大熵的汉语篇章结构自动分析方法
|
18:30-20:30 |
Poster 10: 基于隐主题马尔科夫模型的多特征自动文摘
|
18:30-20:30 |
Poster 11: 面向中文网络百科的属性和属性值抽取
|
18:30-20:30 |
Poster 12: A comprehensive method for Text Summarization based on Latent Semantic Analysis
|
18:30-20:30 |
Poster 13: C-TERN:一种基于CFSA的军事新闻文本时间信息处理算法
|
18:30-20:30 |
Poster 14: 汉语隐式篇章关系识别
|
18:30-20:30 |
Poster 15: Research of an Improved Algorithm for Chinese Word Segmentation Dictionary Based on Double-Array Trie-tree
|
18:30-20:30 |
Poster 16: Study on Tibetan Word Segmentation as Syllable Tagging
|
18:30-20:30 |
Poster 17: 基于句法分析的跨语言情感分析
|
18:30-20:30 |
Poster 18: Simple Yet Effective Method for Entity Linking in Microblog-Genre Text
|
18:30-20:30 |
Poster 19: 面向微博短文本的细粒度情感特征抽取方法
|
18:30-20:30 |
Poster 20: Grammatical Phrase-level Opinion Target Extraction on Chinese Microblog Messages
|
18:30-20:30 |
Poster 21: 多策略中文微博细粒度情绪分析研究
|
18:30-20:30 |
Poster 22: 基于社会关系网络的半监督情感分类
|
18:30-20:30 |
Poster 23: Research on Semantic-based Passive Transformation in Chinese-English Machine Translation
|
18:30-20:30 |
Poster 24: 一种无监督的中文漫画对白自动定位方法
|
18:30-20:30 |
Poster 25: The Spoken/Written Language Classification of English Sentences with Bilingual Information
|
18:30-20:30 |
Demo 1: Research on the opinion mining system for massive social media data
|
18:30-20:30 |
Demo 2: Design and Implementation of News-Oriented Automatic Summarization System Based On Chinese RSS
|
18:30-20:30 |
Demo 3: 基于风格模仿的中国书法合成
|
18:30-20:30 |
Demo 4: 西夏文数字化处理研究
|
CIT Applications 1 返回 时间:2013年11月19日下午(14:00–15:20); 君豪-豪景厅; Chair:杨沐昀 |
|
14:00-14:20 |
A Unified Framework for Emotional Elements Extraction based on Finite State Matching Machine
|
14:20-14:40 |
面向话题的新闻综述报告自动生成研究
|
14:40-15:00 |
Query Generation Techniques for Patent Prior-Art Search in Multiple Languages
|
15:00-15:20 |
Automatic Assessment of Information Disclosure Quality in Chinese Annual Reports
|
Machine Translation 2 返回 时间:2013年11月19日下午(14:00–15:20); 君豪-豪信厅; Chair:吕雅娟 |
|
14:00-14:20 |
A Method to Construct Chinese-Japanese Named Entity Translation Equivalents Using Monolingual Corpora
|
14:20-14:40 |
日语时间表达式识别与日汉翻译研究
|
14:40-15:00 |
基于加权词汇衔接的文档级机器翻译自动评价
|
15:00-15:20 |
Pseudo In-Domain Data Selection from Large-Scale Web Corpus for Spoken Language Translation
|
Fundamentals 2 返回 时间:2013年11月19日下午(14:00–15:20); 君豪-豪仕厅; Chair:荀恩东 |
|
14:00-14:25 |
Chinese Negation and Speculation Detection with Conditional Random Fields
|
14:25-14:50 |
藏文文本自动校对方法及系统设计
|
14:50-15:20 |
Language Model for Cyrillic Mongolian to Traditional Mongolian Conversion
|
NLP for Social Networks 返回 时间:2013年11月19日下午(15:50–17:10); 君豪-豪景厅; Chair:何婷婷 |
|
15:50-16:10 |
Research on Building Family Networks Based on Bootstrapping and Coreference Resolution
|
16:10-16:30 |
Learning Sentence Representation for Emotion Classification on Microblogs
|
16:30-16:50 |
Every Term Has Sentiment: Learning from Emoticon Evidences for Chinese Microblog Sentiment Analysis
|
16:50-17:10 |
Active Learning for Cross-Lingual Sentiment Classification
|
Web Mining & QA 返回 时间:2013年11月19日下午(15:50–17:10); 君豪-豪信厅; Chair:秦兵 |
|
15:50-16:10 |
基于知识库的中文自然语言问句的自动理解
|
16:10-16:30 |
A Hybrid Approach for Extending Ontology from Text
|
16:30-16:50 |
Expanding User Features with Social Relationships in Social Recommender Systems
|
16:50-17:10 |
Simulated Spoken Dialogue System Based on IOHMM with User History
|
CIT Applications 2 返回 时间:2013年11月19日下午(15:50–17:10); 君豪-豪仕厅; Chair:徐金安 |
|
15:50-16:10 |
中文电子文档的数学公式定位研究
|
16:10-16:30 |
基于语义构件的甲骨文字库自动生成技术研究
|
16:30-16:50 |
基于特征加权的汉字点笔画生成研究
|
16:50-17:10 |
Structure-based Web Access Method for Ancient Chinese Characters
|
Innovation Demo 技术成果展示
Innovation Demo 技术成果展示 返回 时间:2013年11月17日晚上-11月19日中午; 君豪-大宴会厅 |
|||
参展单位 | 展示成果 | 展位/联系人 | 成果简介 |
明博教育科技有限公司 | 优课数字化教学应用系统 | A展位 / 扈超 |
“优课数字化教学应用系统V3”是国内首家以正版教材内容为核心的教学应用系统,定位于基础教育课堂信息化同步教学应用的工具和服务平台。 该系统由云服务平台以及教师、学生、机构管理三大客户端软件组成。以海量的教学资源和丰富的客户端应用,为终端用户提供教学应用、教学互动以及资源管理共享等全环节服务支撑,为教育机构快速构建智能、高效、开放、易用的教学应用平台。 |
四川省计算机研究院 | 四川移动导游系统 | B展位 / 刘营 |
四川移动导游系统实现了一机在手,游遍四川。 该系统利用现代信息技术和移动手机技术,推出了基于GPS(GIS)定位的旅游信息推送,景点音频/视频/图片/文字解说,景点浏览、搜索及电子地图导游,并支持多国语言。 该系统很好地满足了游客无论是旅游出行前规划吃住行游,旅游中的导游解说、周边搜索及线路导航, 还是旅游结束时邮购旅游产品和发表旅游攻略等的需求。 系统收罗了四川所有的4A级以上景区、四川特色景区及农家乐,支持在线导游模式和离线阅读模式。 |
福建星网锐捷网络有限公司 | C展位 / 张向阳 |
锐捷网络,是中国网络解决方案领导品牌。自2000年1月成立以来,公司秉承“敏锐把握应用趋势,快捷满足客户需求”的核心经营理念,用持续创新的技术及解决方案,实现用户网络应用价值的最大化。目前,锐捷网络已连续6年成为“中国企业网第一民族品牌”,位居中国网络市场三大供应商之列。 今天的锐捷网络,在全国拥有3000名员工,38个分支机构,5个研发中心(福州、上海、北京、成都、天津),营销及服务网络覆盖全国和东南亚、欧洲、南北美洲、中东等国际市场。其业界领先的IP网络、IP安全、IT运维管理等全系列产品及解决方案广泛应用于政府、金融、教育、医疗、企业、运营商等国内外信息化建设领域。锐捷网络率先在国内发布首个全面具备云计算特性的数据中心交换机产品家族,成为云计算平台的网络的民族领航者。 锐捷网络解决方案已广泛应用于全国1950余所高校及20000多所中小学。已连续7年位居教育行业市场占有率排名第一。并凭借卓越的端到端解决方案能力,锐捷网络为北京奥运会、广州亚运会、深圳大运会、伦敦奥运会报道、中国下一代互联网示范工程(CNGI)等国家级重点网络建设工程提供全面的网络技术支持。 2010年6月23日,集团公司福建星网锐捷通讯股份公司在深交所成功挂牌上市(股票代码:002396)。集团公司的上市,为锐捷网络提供了一个更加广阔的发展平台和更加坚实的发展基础。 |
|
微软亚洲研究院 | 微软亚洲研究院自然语言处理创新成果 | D展位 / 周明 |
微软对联(http://duilian.msra.cn) 微软对联是由世界上第一套人工智能对联系统。当用户给定上联,它能够自动提供若干下联供用户选择; 并且当用户确定一副对联后,它还能够生成若干四字横批供用户参考。 微软必应词典(http://cn.bing.com/dict/) 微软亚洲研究院研发的新一代在线词典,是微软首款中英文智能词典。可提供中英文单词和短语查询、自动翻译、网络新词解释、语音朗读等众多特色功能,为英文学习和英文写作提供帮助。 微软必应词典依托微软强大的技术实力,及时发现并收录网络新兴词汇,让您的词典永不过时。 微软云输入法(http://bing.msn.cn/pinyin/) 微软亚洲研究院研发的新一代输入法。利用网络挖掘获取最新词汇和语料,快速更新语言模型和翻译模型,提供云上的输入服务。同时整合了必应的搜索体验,提供了输入法应用开放平台。进一步提升了输入法的智能化水平。微软输入法界面十分干净,无广告、无插件。即使是在性能相对不高的电脑上,也可以流畅的输入。目前已用于微软必应搜索和微软视窗操作系统中。 微软英库问答 微软亚洲研究院研发的领先的通用领域问答系统。对用户给出的问题,通过对自然语言问题的深度理解,从知识库、互联网以及问答社区获取候选答案和证据,并通过自动推理、答案排序、可信度估计等步骤,最终提供精确的答案。英库问答可以广泛用于自然语言搜索、人机接口、商业智能、语音助手等应用场景中。 |
北京网感至察科技有限公司 | TML文本挖掘编程语言及其应用 | E展位 / 李佳静 | TML(Text Mining Language)是一种通用的文本挖掘编程语言, 旨在提供一种简单通用的途径,让用户能够对文本中的各种语义目标进行分析和计算。 我们为此设计了这个语言的语法、编译器、虚拟机和图形化开发与调试环境,使用户可以针对任何应用领域轻松地进行编程以制定文本挖掘的分析目标、分析范围和 分析手段, 用户代码进而会被编译成字节码在虚拟机内高效执行。TML高效地实现了大量实用文本分析技术,包括网络爬虫、文本抽取、分词、词性标注、命名实体抽取、文 本分类、情感分析、概念与关系抽取等。这些技术以计算符号和保留词的形式体现在TML语法中。使用TML,构建了购买意愿、品牌口碑和竞争情报三 个领域的知识库,并以此为基础推出了面向企业客户的营销、口碑、情报云服务。 |
哈尔滨工业大学 | 哈工大社会计算与信息检索研究中心成果 | F展位 / 秦兵 |
哈工大社会计算与信息检索研究中心的研究方向包括语言分析、信息抽取、社会网络、用户分析、问答系统和情感分析六个方面。研究中心在多项国家项目和企业合作项目的支持下打造出语言技术平台、开放域信息抽取、篇章语义分析及社会媒体分析等技术平台。 其中我实验室开发的“微博情绪指数平台”通过实时地收集和分析微博数据,可监测出全国各省的情绪走势图,并标注出情绪触发事件词。为舆情分析中的突发事件识别、情绪监测,以及电子商务中的用户需求分析和产品推荐等提供了必要的技术支撑。 |
数字出版技术国家重点实验室(北大方正集团有限公司) | 普适性文档(CEBX)技术及其应用 | G展位 / 汤帜 | CEBX是新一代普适性文档技术,融合了固定版式信息和结构化的流式信息,解决了数字出版中的终端多样化所带来的问题,使一个文档能够同时支持PC、手机、平板电脑、电子阅读器等终端的阅读,可以实现一次制作、多平台多次利用,既可以原版原式地显示或打印,又可以在移动设备上更好地实现高质量的屏幕自适应和实时排版。同时,其原版原式、动态交互等诸多特性,也使得CEBX能够在文档存储、办公自动化、电子病历、电子书包等多个行业、领域中有着广泛的应用。方正阿帕比(Apabi)采用CEBX技术研发的明星产品——“中华数字书苑”多次被国家领导人作为国礼赠送给英国剑桥大学、比利时鲁汶大学、德国柏林国家图书馆等海外机构。 |
华为技术有限公司 | 华为大数据存储助力欧洲核子研究中心应对EB级数据挑战 | H展位 / 袁超 |
CERN是世界上最大的粒子物理研究组织,每年有超过20 PB的有关大型强子对撞机(Large Hadron Collider)的研究数据需要存储和分析。CERN最新发现希格斯粒子(上帝粒子),是当前物质理论中最后一个被发现的粒子,揭开了充斥在宇宙中的暗物质的神秘本质。 华为拥有业界领先的存储专家和卓越的技术经验, 2012年年初,华为大数据存储系统交付到CERN,在发现上帝粒子的大规模并行计算和数据存储中,表现出卓越的读写性能和极佳的可扩展性。该系统还具备智能的自我修复功能,大大降低了维护成本,同时有效地提高了存储系统的可用性和可靠性。 “CERN在执行数据密集型模拟和分析方面正在面临极限,同华为的合作为我们展现了一个令人激动的新途径,我们看到华为大数据存储优良的架构设计,使得CERN在应对未来EB级数据量的挑战时能够轻松以对。”CERN OpenLAB的总负责人鲍勃•琼斯说。 |
搜狗 | 搜狗知立方 | J展位 / 王伟达 | 为了让用户获取信息更简单,搜狗搜索发布全新的知识库搜索引擎--“知立方”,这是国内搜索引擎行业中首家知识库搜索产品。知立方通过整合海量的互联网碎片化信息,对搜索结果进行重新优化计算,将最核心的信息展现给用户。而这就需要区别于传统的“关键词搜索”,不是单纯的抓取网页数据,而是引入“语义理解”技术,试图理解用户的搜索意图,才能将搜索结果准确地传递给用户。 |
重庆大学 | 重庆大学中文计算研究 | K展位 / 李宽 | 目前重庆大学的中文计算研究团队主要致力于文本分类技术的研究,包括文本表示及短文本分类等方面。文本表示是文本分类的重要步骤,为克服词袋模型维数过高且不能表示词语之间相互关系以及现有语义分析过于复杂的缺点,提出了简明语义分析技术,通过文档的类别构建概念空间来实现简洁的语义分析。实验表明,这种方法在文本分类中可以达到或超过其他表示方法所能取得的最好成绩,同时可大大减少计算时长。短文本分类是近来研究的热点之一,其中的一项研究把英中双语例句分为英语口语/书面语,以帮助我国英语学习者区分两种语类,主要探索在信息缺乏的短文本中如何更好地利用各种特征。实验表明,“中文汉字+句子长度+平均音节数”或类似的特征组合能取得较好的分类效果。 |
时间:2013年11月19日14:00-17:00 地点:重庆大学主教学楼 返回 |
|
学术交流 | 朱晓瑾教授 |
技术交流 |
◆微软亚洲研究院 ◆哈尔滨工业大学 ◆四川省计算机研究院 ◆数字出版技术国家重点实验室 ◆重庆大学 ◆华为技术有限公司(展示车) |
活动安排 |
◆14:00-15:00,朱晓瑾 ◆15:00-15:30,机构宣讲,哈尔滨工业大学 ◆15:30-16:00,机构宣讲,数字出版技术国家重点实验室 ◆16:00-16:30,机构宣讲,华为技术有限公司 ◆16:30-17:00,学术和技术交流 |
[--完--]
会议主办方 | ||||
会议承办方 | ||||
会议协办方 | ||||
会议赞助方 | ||||