1129日上午,计算机工程学院邀请省产业教授、苏州派维斯信息科技有限公司创始人——李华康博士做线上讲座,讲座主题为“文本挖掘方法及应用”,面向计算机工程学院专业教师和学生代表。

李华康博士是高级工程师,日本会津大学博士,上海交通大学博士后,西交利物浦大学副教授、博士生导师。曾承担并完成国家自然科学基金、中国博士后科学基金、江苏省博士后科研基金等10余项技术研发项目,发表SCI/EI学术论文50余篇,申请发明专利30余项。李华康博士作为苏州高新区领军人才、江苏省双创博士,拥有多年大数据和自然语言处理项目研发经验。担任中国人工智能学会会员、省软件信息标准委员会、省人工智能学会知识工程专委、省科技咨询专家,为KBSKAISAIHC等国内外知名期刊审稿。

李博士的报告主要探讨文本挖掘领域的基础过程,报告内容深入浅出,既有深度的学术知识、又有脚踏实地的工业应用,报告包含以下几个部分:文本数据准备、预处理、文本分类、情感计算、应用分享。李博士从数据集入手,详细的介绍了学界和工业界常用的数据集,并介绍了如何使用爬虫和预处理工具自行获取、清洗、存储数据。接着,李博士讲解了使用何种特征和分类器对数据进行分析,最终实现情感分析、观点挖掘、舆情分析,并将应用范围推广到国家知识产权局的项目——专利比对技术。该项目主要使用全文段落比对、全文关键词、图匹配算法等核心技术。

本次学术报告会既拓宽了师生们的专业视野,也为学院持续推进产教融合提供了方向。今后,学院将更多举办IT新兴领域的专题学术报告,为推进科技创新与社会服务工作持续营造良好的科研氛围。