研究领域

上海交通大学 计算机系 中德语言技术联合实验室

主要研究方向包括:

  1. 信息检索与抽取技术:研究基于Internet的信息检索和信息抽取技术,旨在实现一个智能化的信息获取平台:实现自动文本分类、聚类;关键字,术语、概念的自动抽取研究;探索特定事件的自动获取;研究Web内容挖掘的多种技术与方法。
  2. 多语种信息的智能化处理: 研究多语种文本信息的自动处理,包括:多语种命名实体识别,多语种语法、语义、语用分析与处理,实现多语种语言的自动理解。
  3. 用户模型与信息服务: 当今是一个信息爆炸的年代,如何满足不同用户对不同信息的自动获取,是研究的目的之一,主要研究基于Internet的各种用户的搜索模型,更好的描述与表示用户的不同需求,提供各种为不同企业定制的信息服务。
  4. 机器学习技术:研究在语言技术中如何应用机器学习技术,实现面向现实世界的各种应用系统。机器学习从很多学科中吸收了成果和概念,包括人工智能、概率论与数理统计、哲学、信息论、生物学、认知科学和控制论等,并以此来理解问题的背景、算法和算法中的隐含假定。
  5. 意见挖掘:研究主观性文本语料标注规范、意见挖掘预处理技术、主观性文本的过滤(分类)技术、意见主题抽取技术、意见情感分析技术、分析结果可视化技术和意见挖掘技术的应用等。

目前正在从事的研究:

  1. 新闻事件线索与主题探测研究:
    自动探测话题(种子事件与相关事件的集合)内在结构,表示话题内事件随时间的演化,已成为当今信息过载 急需解决的问题之一。本项目在前期事件信息抽取的基础上,研究新闻话题的描述模型,引入概率模型(LDA),建立具有新闻报道特征的新闻话题描述模型;研 究新闻话题事件的关联模型,特别是因果关系和细化关系(elaboration)的判断准则;研究话题随时间的演化模型;研究线索与主题的特征抽取与探测 算法。通过探测新闻话题的线索(话题的内在结构)与主题(随时间的演化),实现自动组织话题,更好地表示热点话题和基于时间特性话题(例如SARS)的发 生与演化过程。前期研究成果请观看我们的系统演示。
    前期研究小组成员:周凯,李峰,冯礼,毛顺福,蒋德良,陆伟
    目前项目组组长:楚克明
    项目组成员:王全剑,丁小杉,项晨,黄天柱,李斌
    项目负责人:李芳
  2. 个性化搜索中用户兴趣的发现与分析研究 :
    在INTEL项目(基于网页内容青少年兴趣自动获取研究)的基础上进一步改进。主要是1)增加网页予处理,改进聚类算法,提高精度 2)聚类结果(关键字)映射为用户兴趣类别3)研究用户兴趣随时间的变化。前期研究成果请观看我们的系统演示。
    前期研究小组成员:李峰,周凯,李翼鸿,王昕光,吴雁琛
    目前项目组组长:郑栋辉
    项目组成员:李翼鸿,王昕光,吴雁琛,STEPHAN
    项目负责人:李芳
  3. 细颗粒度汉语文本意见挖掘方法的研究(国家自然科学基金项目)
    Research on Fine-Grained Opinion Mining for Chinese Texts (NSFC Project)
    项目负责人:姚天昉
    项目成员:
    中方:张冬茉、李林琳、张霄凯、尹航、黄高辉、刘全升、宋鸿彦、刘军、张潇君、陈漠沙
    德方:Hans Uszkoreit, 徐飞玉、程希文、王睿
    项目简介:
    对主观性文本进行意见挖掘是一个新颖而且十分重要的研究方向。
    本项目所要研究的内容是:
    (1)汉语意见型主观性文本的标注;
    (2)汉语意见型主观性文本的自动分类;
    (3)汉语意见型语句主题的识别;
    (4)汉语意见型语句情感的分析;
    (5) 汉语意见型语句主题和情感之间关系的识别。这项研究从解决汉语意见型主观性文本中句子主题、情感以及它们之间关系识别问题入手,以计算语言学和人工智能理 论为基础,提出并实现适合于汉语意见型主观性文本的细颗粒度意见挖掘方法。所采用的方法发挥了统计和自然语言处理方法的综合优势,以达到最大程度地挖掘可 用的细颗粒度信息和知识的目的。此项语言技术不仅可以提供给其它自然语言处理系统(应用)使用,如文本分类、文本过滤、自动摘要、自然语言生成、问答系 统、对话系统、机器翻译等;还可应用于许多日常生活的领域,如电子商务、电子学习、商业智能、报刊编辑、企业管理、信息监控、民意调查等。

已完成项目:

  1. 智能化信息检索平台 (市科委项目 2004-2006  项目负责人:李芳)
    研究小组负责人:韩颖 参加人员:刘克彬,刘磊,冯礼,周凯,李峰等
  2. 基于网页内容青少年兴趣自动获取研究( INTEL 项目 2007-2008 项目负责人:李芳):
    应用语言技术,通过分析上网记录和网页内容,自动生成兴趣爱好摘要。
    研究小组负责人:李峰,成员:周凯,李翼鸿,王昕光,吴雁琛

Posted on 五月 27th, 2009 by admin

Comments are closed.



Categories

Archive

Links

Meta

Copyright © 2017 中德语言技术联合实验室. All rights reserved.

Tech Blue designed by Hive Designs • Ported by Free WordPress Themes and Linux Web Hosting