香港浸会大学理学院院长暨数学及数据科学讲座教授吴国宝教授,最近获得学术界两项荣誉。吴教授成为科睿唯安(Clarivate)「2025年度最广获征引研究人员」,论文在数学范畴的被引次数字列全球前1%。
而他的研究项目 “Theoretical Methods for Conceptual Representation and Interpretation of High-Dimensional Data” 荣获北京市科学技术奖二等奖。奖项就其在基础研究的重要贡献 (请按此浏览连结) 予以肯定。

吴国宝教授成为科睿唯安(Clarivate)「2025年度最广获征引研究人员」及荣获北京市科学技术奖二等奖。
这些荣誉丰富了吴教授本已十分杰出的学术履历。他早前已当选为美国数学学会(American Mathematical Society, AMS)及工业与应用数学学会(Society for Industrial and Applied Mathematics, SIAM)会士。被评为全球2%最高被引科学家之一,并曾获颁第十二届冯康科学计算奖。
在这次访谈中,这位兼具数学与计算器科学背景、善于从「优雅」与「可扩展性」角度思考问题的科研学者,分享了他一以贯之的研究视野——如何从具体工具出发,发展出一套可推动科学发现的普适框架。
問:你结合深厚的数学功底与计算方法,处理庞大而复杂的数据库。相较于为每个应用开发专属模型,建立能跨领域应用的通用基础工具究竟有何优势?
答:尽管数据来源各异,庞大而复杂的数据库往往具有相似的基础结构;处理数据的方法或大相径庭,但底层的数学逻辑总会保持一致。
对我来说,真正的力量来自对数学的深入应用。当你构建的工具植根于扎实的理论基础时,它不会局限于解决某一个问题,而是整个类别的问题——甚至是你尚未遇见的问题。这正是数学的魅力所在:它为正确性与可扩展性提供保证。
我们研究中的一个清晰例证是一系列矩阵分解(matrix factorisation)技术。它源自多面体理论(polyhedral theory)与凸几何学(convex geometry),应用于遥感领域的高光谱分离(hyperspectral unmixing)。以普遍的数学特性作为核心,我们仅需微调一些步骤,它便可以在基因组学中同样凑效,如在 TCGA 癌症队列中侦测罕见恶性克隆,或在单细胞 RNA 测序(single-cell RNA-sequencing)数据中解析更细致的细胞类型。此跨影像与生物学的转移,正是基于基础数学之上,而非倚赖特定领域的假设。
.jpg)
問:展望未来,你认为矩阵与张量方法(数值线性代数与张量运算)将在哪些领域产生最大影响?它又如何塑造你现时推进的研究项目?
「为科学服务的人工智能」与「为人工智能服务的科学」之间并没有高墙。
吴国宝教授
理学院院长
答:观察任何前沿人工智能模型:其权重极具低秩特性(这正是 LoRA〔大型语言模型的低秩微调,Low-Rank Adaptation of Large Language Models〕能如此高效运作的原因)其注意力机制由优化的张量收缩构成,而整个网络就是运行在低维流形上的一个庞大而精密的线性代数引擎。
这一点令人振奋——无论我们观察自然世界,还是观察当前规模最大的模型,所见都是把复杂的结构投影到出人意料的低维线性代数结构之上。这种深层连结绝非表象,而是根本性的。
「为科学服务的人工智能」与「为人工智能服务的科学」之间并没有高墙。数学正好搭建起这道桥梁,新的知识可以在两者之间自由游走。这是我未来五年研究项目的发展蓝图的基石。
問:你的研究聚焦于兼具稳健性与可扩展性的算法,即使面对病态逆问题亦然。如何让你的方案如何在凌乱的数据上,在实用与调校之间取得平衡?
答:我并不把它视为一种取舍,而是一个反馈循环。
多数情况下,我们会从净化的模型下出发(收敛性、稳定常数、精确恢复界限值)。它们会准确告诉我们:方案在哪些条件下是安全的,哪些假设是关键的。现实世界的数据难免会违反部分假设,但正因为我们对理论了如指掌,我们便可以有意识地放宽或修补适当的部分,在哪里用较好的初始值,在哪里采用自适应正则化。
当面对凌乱的数据时,我们从不放弃理论基础。相反地,我们让理论指导每一个实务决策——从预先处理与初始化到参数调度与停止准则。因为我们精确掌握每一个放宽或扰动会如何影响理论界限,才能在确保核心算法忠实于证明的前提下,仅进行理论上合理且必要的最小调整以提升稳健性。由此产生的方案,即使在噪声干扰、数据不完整及大规模问题中,仍能维持有效的可预测性,这正是我们与合作伙伴对研究成果充满信心的根本原因。
按此浏览吴教授的更多出版刊物与研究项目:https://scholars.hkbu.edu.hk/en/persons/kwok-po-ng/
上一则消息
29.12.2025
下一则新闻
19.12.2025



