• 【报告题目】Overview of Statistical Natural Language Processing
  • 发布时间:2016-06-02 00:00:00
  • 中文题目:统计自然语言理解综述
    报告时间:201662日 下午1:30-2:30
    报告地点:金石滩校区综合楼F113
     
    摘要:
        Statistical Natural Language Processing (SNLP) uses probabilistic approaches to infer the structures of text based on statistical language modeling.  It has quickly become an important paradigm for language processing due to its wide range of applications such as Information Retrieval, Document Classification, Text Mining, and Biological Data Analysis.  In this talk, I will explain the basic process of statistical language modeling, illustrating the sparse data problem and the related smoothing techniques through its application to Information Retrieval.  Based on a smoothed language model, we can solve many language-processing tasks using the Bayes’ Theorem in the form of noisy channel framework.  In addition, I will introduce the recent development in topic modeling and show how it can be applied to sentiment analysis, where we can automatically classify review documents into positive and negative sentiments so that consumers can make a decision about the related product or service.
     
    个人简介:
    宋飞教授在1991年毕业于加拿大滑铁卢大学,并获得计算机博士学位。毕业后,任职于圭尔夫大学计算机学院。研究领域包括自然语言处理,信息检索,文本分类,评论情感分析,关键短语提取,文本分段,和文本摘要。近期的研究主要是将话题提炼应用于评论的情感分析,以便能将客户的评论自动的分成正面和负面的评价。
    宋教授一直致力于将研究应用到实际。从20005月到20036月,借着停薪留职的机会来到美国波士顿工业界工作。任职于AskJeeves搜索引擎公司,并主导设计和开发了拼写检查系统。在2006年到2010年,两次成功地申请到了安省OCE的研究经费,并与当地的NetSweeper公司合作开发了多个软件系统,用于不良网络内容的检测和阻断,包括特征选择、文本分类、文本分段、人物检索、情感分析和文本摘要。
                                                                                                                                                            
 
地址:大连经济技术开发区辽河西路18号   邮编:116600   辽ICP备08006090号