KDD China 2024数智未来研讨会暨 KDD China 2024 Summer School 在西南交通大学召开

来源：计算机与人工智能学院发布日期： Mon Aug 19 00:00:00 CST 2024 浏览次数：3333

2024年8月16日-17日，由SIGKDD在中国的唯一官方分支机构 ACM 数据挖掘中国分会（KDD China）主办，西南交通大学计算机与人工智能学院、可持续城市交通智能化教育部工程研究中心、人工智能研究院、科学技术与发展研究院、唐山研究院、经济管理学院、继续教育学院承办，四川省人工智能学会、西南财经大学计算机与人工智能学院、四川轻化工大学计算机科学与工程学院、特殊教育语言智能四川省哲学社会科学重点实验室协办的KDD China 2024数智未来研讨会暨 KDD China 2024 Summer School在西南交通大学九里校区国际会议厅隆重召开。

微众银行首席人工智能官、加拿大皇家科学院和工程院院士、香港科技大学杨强教授，欧洲科学院院士、南京大学副校长周志华教授，KDD China主席、京东集团副总裁郑宇教授，KDD China副主席、百度集团执行副总裁沈抖博士，KDD China副主席、清华大学唐杰教授，KDD China秘书长、西南交通大学李天瑞教授，KDD China司库、中国科学技术大学陈恩红教授，以及天壤创始人兼首席执行官薛贵荣博士，澳门大学巩志国教授，北京交通大学于剑教授，东南大学张敏灵教授，南京大学黎铭教授等25位KDD China委员和候补委员、7位嘉宾、12位青年学者特邀主持、50余位各个院校的教师、线上线下上万人齐聚蓉城，共探数据驱动的智慧未来，携手绘制科技发展的宏伟蓝图。会议包括开幕致辞、主旨演讲、奖项颁发、委员增补、圆桌论坛和委员分享六个环节。

开幕致辞

在开幕式上，西南交通大学副校长王平教授致辞，介绍了学校的科技成果和学科建设，并对会议再次在西南交大举办表示欢迎，希望与专家学者一道围绕“数据驱动智能，模型生成未来”的主题，砥砺学术思想，激发学术灵感，加强科研协作，在实际问题和应用场景中携手共进，继续推动中国数据挖掘领域的整体进步和发展。

京东集团副总裁、京东科技首席数据科学家、KDD China主席郑宇教授在大会上回顾了KDD China过去8年的活动，重点介绍了推动大数据与AI产学研一体化的校园访和业界行活动，这些活动不仅加强了学术界与产业界的合作，还为大数据与人工智能技术的发展奠定了基础。

奖项颁发

KDD China按照委员提名、专家推荐、权威评审的总体原则，评选了本年度的KDD China Innovation Award（KDD China杰出成就奖）、KDD China Service Award （KDD China卓越服务奖）、KDD China Rising Star Award（KDD China青年科学家奖）、KDD China Test-of-Time Award（KDD China 论文时间检验奖）和KDD China Dissertation Award（KDD China优秀博士论文奖）五大奖项，在本次会议上进行了公布和颁发。

清华大学唐杰教授荣获了KDD China Innovation Award，以表彰他对数据挖掘领域做出的卓越贡献。唐杰教授引领了数据挖掘领域的发展，对行业有深远而持久的影响力，并获得了学界和业界对他个人成就和学术品德的一致认可。京东集团副总裁郑宇教授为唐杰教授颁发了奖杯和证书。

图形用户界面

低可信度描述已自动生成

百度集团副总裁沈抖博士荣获了KDD China Service Award，他是人工智能领域的探索者和实践者，在KDD China组织和重要活动中发挥了关键性作用，获得了广大成员的一致认可和追随。沈抖博士拥有丰富的管理经验，为KDD China事业的发展贡献了热忱、优质的服务，扩大了KDD China在行业中的影响力。郑宇教授为沈抖博士颁发了奖杯和证书。

清华大学东昱晓副教授与刘洋副教授荣获了KDD China Rising Star Award。该奖项表彰在中国数据挖掘领域有突出成就和重要贡献的青年学者，推动其职业生涯的发展。西南交通大学计算机与人工智能学院党委书记李天瑞教授为东昱晓副教授与刘洋副教授颁发了奖杯和证书。

东昱晓副教授在多个国际顶尖会议发表多个成果，近期研究成果包括图神经网络预训练、异构图表示学习及网络嵌入理论和快速算法等。相关研究获WWW 2022, WWW 2019, WSDM 2015最佳论文提名，并应用于脸书社交网络和微软图谱十亿级用户应用。

刘洋副教授在国际上率先提出纵向联邦学习、联邦迁移学习、跨模态联邦学习等基础算法。同时她提出了多个用于异构领域的联邦学习框架广受好评。

在十年前的KDD 2014会议中，一篇题为《A Dirichlet Multinomial Mixture Model-based Approach for Short Text Clustering》产生了深远的影响，至今总引用次数达到了690余次。这篇论文由尹建华副教授和王建勇教授共同完成，聚焦于短文本聚类，针对其稀疏、高维和大容量等挑战性问题提出了一种新算法，为短文本的自动化处理和分析开辟了新路径，在主题挖掘和舆情监测方面发挥了重要作用。郑宇教授为尹建华副教授和王建勇教授颁发了奖杯和证书。

来自清华大学的裘捷中博士（导师：唐杰教授）和张国祯博士（导师：金德鹏教授和李勇教授）分别荣获了2023年度和2024年度的KDD China Dissertation Award。

裘捷中博士的毕业论文《图表示学习的谱理论与自监督学习》在图表示学习的理论基础、算法创新和系统实现方面进行了深入研究，为图结构数据的理解、分析和推理方面做出了重要贡献。

张国祯博士毕业论文《复杂社交行为影响下的用户管理关键技术研究》聚焦复杂社交行为影响下的用户管理关键技术，在共享、直播等社交媒体驱动的新兴产业具有重要应用价值。郑宇教授为两位获奖者及其导师颁发了奖杯和证书。

文本

描述已自动生成

委员增补

KDD China委员会包括3位指导委员会委员、5位执行委员会委员、16位组织委员会委员，以及16位候补委员，本次大会迎来了新的一批候补委员。根据KDD China章程，通过组委会、执委会、指导委员会成员的推荐，经委员投票，最终北京交通大学万怀宇教授和京东城市数据产品部负责人鲍捷博士当选候补委员。KDD China主席郑宇教授为两位新增候补委员颁发了荣誉证书。

主旨报告

香港科技大学杨强教授进行了题为《联邦学习与大模型》的主旨报告，深入探讨了联邦学习在分布式AI和隐私计算中的应用，并介绍了可信联邦学习和联邦大模型的核心概念。杨强教授指出随着数据隐私保护要求的提升和分布式计算技术的发展，可信联邦学习将成为未来AI系统的重要组成部分。

京东集团副总裁郑宇教授以《城市大数据和AI大模型的探索与思考》为题作了主旨报告，详细介绍了AI模型能成功的四大条件：场景驱动、模型架构、强大算力、海量数据并详细介绍了城市知识体系框架。郑宇教授表示，对未来AI技术的发展充满信心，并期待这些技术为城市发展和社会进步带来更多创新成果。

图片包含人, 室内, 桌子, 女人

描述已自动生成

百度执行副总裁沈抖博士作了题为《大模型应用落地案例和经验分享》的主旨报告，介绍了AI大模型在不同场景下的应用案例，深入讲解了当前AI芯片开发和GPU算力管理的发展现状及其面临的挑战，探讨了AI应用开发的新模式，还展示了大模型如何为各行各业带来便利。

南京大学周志华教授以《学件的初步探索》为题作了主旨报告。周志华教授认为，大模型应该被更深入地利用，以充分挖掘其潜在红利，但也指出大模型并不能解决所有问题，提出学术界应尝试探索新的方向，并向我们介绍了一条不同于大模型的道路：学件，以有效缓解大模型所面临的挑战，并欢迎大家共同探讨和研究学件的发展。

清华大学唐杰教授作了题为《ChatGLM：从大模型看AGI的发展》的主旨报告，首先介绍了GLM的基本架构和原理，以及其国际影响力，还展示了GLM视频生成的实例，呈现了GLM在多模态任务上的应用潜力。接着介绍了国内外大模型发展的现状，引导大家深入探究了AGI和大模型的具体的推理能力。最后探讨了通用人工智能（AGI）的分级标准和未来发展趋势。

南京大学黎铭教授进行了题为《代码大模型：进展与挑战》的报告，讨论了软件开发面临的复杂性挑战，提出了“软件挖掘”作为解决方案，即通过挖掘源代码中的有用知识来促进开发。黎铭教授指出，成功的软件挖掘关键在于对源代码功能和行为的准确建模，认为数据驱动的方法在现代软件开发中越来越重要，而大模型在其中可以发挥关键作用。

北京交通大学于剑教授作了题为《最优分类器及其挑战》的报告，他讲述了传统机器学习方法及深度学习在二分类问题上的局限，介绍了他们课题组在不用核函数的前提下，对二次曲面的非线性可分的问题的探索，提出了种种挑战，指出在未来的工作中要着重于对数据的概率密度分布函数选取的思考。

西南交通大学韩科教授作了题为《城市大气监测管治中的数据创新应用》的报告，从智能化感知、智能化调度、智能化决策三个问题出发，分享了在城市大气监测管制中遇到的处理数据获取，数据处理等问题的经验，深入介绍了城市大气监测的挑战和解决方案。

澳门大学巩志国教授以《提升非平衡图学习性能的数据增强技术》作了主旨报告，提出了在图学习问题中，会遇到图结构不平衡的问题，对解决该类问题的正确性产生影响。针对这一问题，巩教授提出了在单图内及多图间学习局部结构，使用局部结构丰富区域的学习结果，来填补图稀疏区域图，弥补图的结构不平衡问题。最后，巩教授还对正在进行的工作进行了介绍。

文本, 白板

描述已自动生成

东南大学张敏灵教授作了题为《可信与可解释机器学习》的报告，强调了机器学习中结论的可靠性。他首先介绍了机器学习在预测时的过自信和欠自信的问题，随后说明了传统提升模型可靠性的方法通常会牺牲模型性能。为了解决这一问题，张教授提出了对MIXUP模型的改进，这种改进在保证模型性能的同时，也能维持模型的可靠性。

清华大学崔鹏副教授作了题为《人工智能可信性的数据视角从因果到异质性》的报告。报告中提到，分布外泛化能力的缺乏可能在高风险领域引发严重的灾难。崔教授提出，可以从数据的角度入手来解决这一问题，即将关注点从数据拟合转移到数据变化上，为解决分布外泛化能力的缺失问题提供了一种新的视角。

委员分享

西南财经大学杨新教授以《联邦大模型与持续学习》为题介绍了联邦学习与群智协同的概念，阐述了联邦大模型面临的三大挑战：适应环境差、更新维护难、训练成本高，并提出联邦大模型需要持续学习，包括记住学过的知识、学习新知识以及改进已有知识，并对联邦持续学习的特点和问题进行了介绍。

清华大学东昱晓副教授作了题为《理解与探索大模型能力涌现》的报告，展示了不同大模型在处理多种任务时，随着模型规模增加，性能显著提升的情况，还探讨了大模型在特定规模下涌现出新能力的现象，强调了应当选择适当的度量标准来引导和理解大模型能力的涌现。

中国人民大学张静教授进行了题为《基于大模型的结构化数据处理》的报告，报告指出了在处理结构化数据时，直接使用LLM推理可能导致幻觉和知识更新难题，而基于RAG的LLM在处理复杂逻辑方面存在局限。为解决这些问题，报告强调了通过结合大模型和专用工具，以提高处理结构化数据的效率和准确性的重要性。

北京邮电大学石川教授以《图基础模型》为题作了报告。详细介绍了图的发展历史和图神经网络的发展历程，阐述了图模型与大模型互补，提出将两者结合以获得实现不同下游任务的愿景，分析了图预训练模型、谱域图转换器、图转换器等存在的问题和图对齐大语言模型，并提出了一些图基础模型的开放性问题。

清华大学刘洋副教授作了题为《联邦大小模型知识互迁移》的主题报告，首先介绍了大模型时代在联邦学习中模型传输所面临的挑战，重点探讨了数据隐私和模型传输效率的问题。提出了异构化联邦学习作为解决方案，并指出了单一大模型能力存在局限，而多个大模型能够通过互补实现更强的综合能力。

南京大学李宇峰教授作了题为《基于反绎学习的可信推理探索》的报告，强调了将机器学习与逻辑推理结合的重要性，目的是在不牺牲模型性能的前提下，提升模型的可靠性，还展示了如何通过规则知识的提炼精化、双驱动的数知高效优化、推理对齐的可行输出三个方面来构建一个反绎学习模型。

百度高级总监殷大伟博士进行了题为《搜索引擎与大型语言模型》的主题报告，全面介绍了搜索引擎与大型语言模型的交互流程，从任务分解、参考信息检索、以及检索强化生成三个角度探讨了大模型在计算效率、资源配置及实际应用中遇到的问题，并提出了相应的解决策略。

清华大学李勇教授进行了题为《城市大模型：探索与进展》的主旨报告，深入分析了城市问题研究的重要性，并提出以城市大模型作为应对这些问题的有效策略，详细阐述了城市大模型在实际应用中的可行性，以及当前城市时空模型的研究和发展现状，还展示了一些成功的城市大模型应用案例，并对未来的发展方向进行了展望。

浙江大学杨洋副教授作了题为《探索时间序列基础模型》的主旨报告，指出了时间序列模型在跨领域泛化中的挑战，强调了深入研究特定领域内泛化能力的重要性，提出了时间序列模型在三个层面的泛化能力：Sample-level、Task-level、Domain-level，还详细介绍了如何将时间序列模型有效融入医学和电力领域，以解决实际问题。

京东智能城市研究院人工智能实验室主任张钧波以《时空AI:释放城市数据要素价值、激发新质生产力》为题报告了时空人工智能在城市计算理论体系中的应用，提出了时空人工智能学习框架，探讨了如何利用时空散点序列、时空位置序列、时空均匀网络以及时空动态图来构建智能引擎。

北京交通大学万怀宇教授进行了题为《时空轨迹自监督学习》的报告。重点介绍了基于自编码器和对比学习的时空轨迹表示学习方法，分析了时空轨迹大模型的构建，并指出这类模型在捕捉复杂的时空轨迹数据方面的显著优势，能够为时空数据的分析和预测提供更有效的支持。

京东城市数据产品部负责人鲍捷博士作了题为《大规模时空数据管理》的报告，探讨了“大规模时空数据管理”中的挑战和解决方案，指出随着数据量和更新速度的增加，传统系统在处理大规模时空数据时存在性能瓶颈，介绍了多种新兴解决方案，并强调了应对复杂时空数据管理的必要性和技术途径。

圆桌论坛

京东集团副总裁郑宇教授主持了以“AI大模型的深度碰撞”为题的圆桌论坛，嘉宾为北京交通大学于剑教授、百度集团执行副总裁沈抖博士、清华大学唐杰教授、天壤智能首席执行官薛贵荣博士4位专家。整个论坛从数据、算力、算法以及产学研结合四个层面展开，就数据来源、中国自研芯片算力、Transformer架构的未来、学业和工业界是否一定需要致力于大模型研究等多个热点话题进行讨论。现场气氛热烈，观点碰撞激烈，为AI大模型的发展提供了新的思考和方向。

历经一年的等待，KDD China 2024数智未来研讨会暨KDD China 2024 Summer School在万众瞩目下再次回归，这是一场学术界的知识盛宴，内容充实，反响热烈！

本次会议圆满落幕，衷心感谢各位专家的精彩演讲和与会者的热情参与。会议的成功举办为全国范围内数据挖掘与知识发现的专家同行提供了一个学习与交流平台，全面展示了当前人工智能领域的前沿科技和发展趋势，同时也推动了高校、研究机构及知名企业在人工智能领域的合作与研究，为数据挖掘与知识发现领域的进一步发展奠定了坚实的基础。

“长亭外，古道边，芳草碧连天，晚风拂柳笛声残，夕阳山外山”，愿与海内外的同仁们继续交流共进，“知交”不零落！