专题论坛3:大模型时代的知识图谱研究

 

论坛主席:

 

陈华钧

浙江大学计算机科学与技术学院教授/博导,浙江省有突出贡献中青年专家,浙江省高层次人才特殊支持计划科技创新领军人才。担任浙江省数智科技研究会副会长、中国人工智能学会知识工程专委会副主任、Elsevier Big Data Research主编等学术服务工作。主要研究方向为知识图谱、大数据系统、自然语言处理等。以一作或通讯作在Nature Communications、Nature Machine Intelligence、NeurIPS、ICML、ICLR、IJCAI、AAAI、ACL、EMNLP、KDD、VLDB、ICDE、WWW、SIGIR、Nucleic Acids Res. 等国际顶级会议或期刊上发表多篇论文。曾获国际语义网会议ISWC2006最佳论文奖、浙江省科技进步二等奖、教育部技术发明一等奖、中国中文信息学会钱伟长科技奖一等奖、国家科技进步二等奖、深圳市科技进步一等奖、阿里巴巴优秀学术合作奖、中国工信传媒出版集团优秀出版物一等奖等奖励。

 

 


 

专题论坛3报告嘉宾

 

车万翔 哈尔滨工业大学

主题报告1:ChatGPT浅析

个人简介:车万翔,哈尔滨工业大学计算学部长聘教授/博士生导师,人工智能研究院副院长,教育部青年长江学者,龙江学者“青年学者”,斯坦福大学访问学者。现任中国中文信息学会理事、计算语言学专业委员会副主任兼秘书长;国际计算语言学学会亚太分会(AACL)执委兼秘书长。目前承担国家自然科学基金重点项目、2030“新一代人工智能”重大项目课题等多项科研项目。著有《自然语言处理:基于预训练模型的方法》一书。曾获AAAI 2013最佳论文提名奖。负责研发的语言技术平台(LTP)已授权给百度、腾讯、华为等公司付费使用。2016年获黑龙江省科技进步一等奖(排名第2),2020年获黑龙江省青年科技奖。

报告摘要:2022年11月30日,OpenAI推了全新一代的对话式人工智能工具——ChatGPT,因其表现出了惊艳的语言理解、生成以及知识推理等能力,获得了全网的热议和关注。ChatGPT的成功表现,使人们看到了解决自然语言处理这一认知智能核心问题的一条可能的路径,并被认为向通用人工智能目标迈出了坚实的一步,将对搜索引擎等应用构成巨大的挑战,甚至将取代很多人的工作,更将颠覆很多领域和行业。那么,ChatGPT究竟解决了什么科学问题,是如何解决该问题的,以及未来会还有哪些亟待解决的问题呢?希望通过本报告的粗浅分析,能部分回答以上的问题。

 


 

管仁初 吉林大学

主题报告2:生物医学知识图谱的自动构建、更新与自省

个人简介:管仁初,吉林大学“唐敖庆”学者领军教授,博士生导师,大数据智能认知国际科技合作吉林省重点实验室副主任。研究方向为机器学习、生物信息学与知识工程。面向生物学和医学等领域大数据分析中的标记样本不足等问题,提出了一系列基于半监督学习、元学习和大规模预训练模型的复杂关系抽取与识别模型。发表相关学术成果论文60篇,其中在Nature Communications (Highlighted paper), IEEE TKDE, Briefings in Bioinformatics, SIGIR等中科院一区期刊、CCF A类期刊/会议以第一或通讯作者发表论文20篇,ESI 高被引论文2篇,授权国家发明专利3项。相关成果被美国伊利诺依大学香槟分校Philip S Yu教授等20余位IEEE Fellow和国际知名学者引用2000 余次(Google Scholar),其中Web of Science 引用1100余次。作为课题负责人承担国家重点研发计划BT&IT专项,承担国家自然科学基金项目3项,参与国家科技创新2030-“新一代人工智能”重大项目1项。

报告摘要:生物医学大数据中蕴含着各种各样的复杂关系和知识,如何从海量多模态数据中自动地抽取关系与发现知识是亟待解决的技术难题。面向生物医学科技文献数据,结合深度学习和迁移学习方法,我们提出了一系列实体识别、复杂关系抽取与融合更新方法,发现了有趣的领域知识并构建了包含60余万个实体和840余万条边的生物医学认知图谱。开发的知识推荐系统已为60余个国家和地区的学者提供服务。

 


 

张强 浙江大学

主题报告3:知识图谱在交叉学科领域的研究与应用

个人简介:张强博士,浙江大学杭州国际科创中心百人研究员,曾在英国G5名校的伦敦大学学院(University College London)计算机系攻读博士学位并担任博士后,师从国际著名的信息检索与数据挖掘领域的Emine Yilmaz教授。他的研究主要涉及到机器学习、自然语言处理、知识图谱和生物分子智造等方向,在Nature Machine Intelligence、NeurIPS、ICML、ICLR、AAAI、WWW、ACL等人工智能顶级学术会议和SCI期刊发表三十余篇文章。他担任中国中文信息学会语言与知识计算专委会委员,教育部知识工程虚拟教研室成员,Big Data Research(中科院3区期刊)编辑,主持或参与多项政府和企业资助的研究项目。

报告摘要:机器学习与大数据技术驱动的科学研究第四范式,在合成生物学、分子与材料、生命健康等多个领域取得了广泛的应用。考虑到各学科领域积累了几十、上百年的专家知识,恰当地利用领域知识,可以提高机器学习模型的泛化性和可解释性。因此,本次报告将针对AI+生物、化学的交叉学科领域,建立知识图谱,研究知识-数据双驱动的机器学习模型,利用领域知识提升低资源学习方法,在蛋白质和化学分子的属性预测、功能判断、合成设计等众多评测任务上取得了良好效果。所研模型将作为人类与自然沟通的桥梁,帮助人类更好地理解并改造自然。

 


 

宋丹丹 北京理工大学

主题报告:知识图谱实体对齐相关研究

个人简介:宋丹丹,北京理工大学计算机学院长聘教授,博士生导师。北京市青年英才、斯坦福大学访问学者、微软铸星计划青年学者。分别于2004年与2009年在清华大学计算机科学与技术系获得本科及博士学位,主要研究方向为知识挖掘、自然语言处理与生物信息。在Nature子刊、ACL、SIGIR、IJCAI、AAAI、WWW等顶级国际会议和重要学术期刊上发表数十篇学术论文,主持国家重点研发计划课题、国家自然科学基金等多项国家项目,获国防科学技术进步奖。

报告摘要:实体对齐任务旨在从两个知识图谱中识别出引用现实世界中同一对象的实体,这对于不完整知识图谱的补全、知识图谱的融合等都起着至关重要的作用。本报告将围绕知识图谱实体对齐的国内外研究现状和研究发展趋势进行介绍,并介绍讲者实验室在实体对齐方面开展的一些工作和研究思路。

 


 

投稿联系人: 王恩
联系电话: 13756494481

注册费咨询及酒店预订联系人:刘宇舟

联系电话: 18166855855
工作邮箱: nciip2023@163.com
通讯地址: 吉林省长春市前进大街2699号吉林大学前卫南区计算机楼
邮 编: 130012

注册缴费 提交稿件