对话李海翔:AI让数据库的“路”走的更远

近日,AIGC开放社区联合科技慢半拍播客栏目,邀请数据库行业的资深专家李海翔先生,共同讨论了数据库的历史渊源、国内外发展状况以及未来发展前景等话题。通过权威专家深入浅出的解析,帮助广大听众全面和系统地了解数据库发展的历程与方向,同时也凸显出数据库技术探索之路还很漫长。以下是访谈的主要内容:

您是如何看待全球数据库的发展历史?

数据库是计算机信息化工作中一个重要的基础技术。回顾一下数据库的发展历史,以及关系型数据库在这个发展过程中起到的重要作用。早期数据库主要有导航数据库,通过指针链接的方式组织数据结构,例如层次模型和网状模型。这种数据库的优势在于符合现实世界中的关系,但是理论基础不够完整。

70年代,IBM的研究员Todd提出了关系模型理论。他将数据抽象成二维表格形式,即关系,通过选择、投影、连接等操作来处理数据。这奠定了关系型数据库的理论基础。关系型数据库理论具有较为完整的理论体系支撑,例如关系完整性约束保证数据正确性,范式理论指导数据库设计。这套理论体系也成为了关系型数据库后来取得成功的重要原因。所以,关系型数据库很快在市场中占据了主导地位。直到今日,无论是传统型数据库还是分布式数据库,理论基础都还是采用了关系模型。

我们在研发新技术时,不光需要考虑实用性,而是应重视理论研究,只有理论作为基础,产品才可能长久发展。

中国的数据库又是如何崛起的?

数据库在中国得以逐步发展,主要经历了三个阶段。

第一阶段是早期随着高校信息管理课程的开设,数据库理论研究开始起步。70年代中期,首届中国数据库学术会议的召开,标志着数据库学科在中国的形成。但当时国产数据库企业规模小,市场主导权在国外企业手中。在上个世纪90年代,随着改革开放的深入,国外数据库技术大规模进入中国。本土数据库企业如人大金仓、达梦等相继成立,为满足日益增长的数据库需求尝试提供解决方案,但发展环境仍不利。

2000年后,代表着国内数据库发展的第二个阶段,互联网公司如阿里巴巴开始自主研发数据库产品Oceanbase,这让国人树立了对国产数据库的信心。本土企业利用学习开源产品的契机,进行创新改进。后来,在著名学术会议上出现越来越多中国数据库论文,标志着技术自主能力增强。

当前,我们可以看到第三个阶段的萌芽,表明中国数据库技术正处于深入发展阶段,不仅可以满足用户需求,还可以不断去创新理论,解决行业中的一些疑难问题。例如数据库与人工智能的融合,以OpenGauss为代表,新的数据库理论体系成为发展方向。

总体来说,数据库在中国经历了学习、模仿、吸收外资阶段,及后来本土企业利用互联网平台进行创新,树立自信心,技术自主能力不断增强。这为今后深入创新奠定坚实基础。中国数据库已成功实现从引进到与国外产品并驾齐驱的跨越。

您如何看待分布式数据库的演进与发展?

数据库技术已经发展了数十年,传统单机型数据库已经成熟且稳定,即使如此,从更高层次来看,数据库还有很多问题待解决和发展空间。分布式数据库的出现很好地解决了单机数据库的一些限制,但同时也引入了新的挑战。从技术发展的角度看,分布式数据库也可以分为三个阶段:研究阶段(1960-90年代),这是数据库概念形成和分布式数据库理论研究的阶段,在这个过程中提出了两阶段提交等分布式事务处理技术。使用阶段(1990年代至今),出现了第一代商业级分布式数据库产品,标志着分布式数据库技术进入产品化应用阶段。目前是,新一代分布数据库的创新阶段,随着需求和理论的成熟,将探索解决传统数据库无法解决的数据正确性、高性能等问题,开创更高层次的分布式数据库技术。

分布式数据库在应用层面还有很多问题需要解决,从应用层面来看,一是不能在分布式环境下百分之百保证数据正确性,同时又能保证高性能。二是数据库操作和维护难度很大,DBA的工作量较高。三是缺乏体系化的解决方案,例如从数据库内核到运维的全链路优化。

接下来,数据库行业的研发者会持续探索如何在分布式场景下,同时保证百分之百正确性和最大限度提高性能,研发更高效易用的数据库产品,同时伴随着人工智能技术的发展,数据库也将面临重要革新。

总体来说,数据库将是一个长期发展的领域。虽然历史悠久,但李老师认为当前阶段仍然是刚刚起步,将有更广阔的研究空间。只有持之以恒地解决应用层面难题,数据库技术才能迈上新的台阶,这需要数据库从业者的共同努力。

目前来看,您如何对比国内和国外分布式数据库发展情况?

国内分布式数据库技术已经迅速发展,但与国际先进水平相比仍存在一定差距。分布式数据库发展需要长期积累,国外一些公司得益于起步早,技术基础更深厚。代表产品如CockroachDB,在正确性和稳定性等方面表现优异。目前,国外的数据库研发,还是靠一些有经验老研发人员在一直维系。国内虽然起步较晚,但目前支持研发的企业和机构还很多,研发人员的新鲜血液也不断涌入,开发热情十分高涨,在应用领域去不断追赶国外产品。

国内数据库也在不断“走出去”。部分厂商将产品输出东南亚或欧美市场,一些企业是通过系统集成带动数据库出海,国内的数据库产品也在小范围内获得了国外的认可。整体来说,国内分布式数据库走向成熟,但国际影响力仍需进一步扩大。

总体上看,国内分布式数据库的发展,得益于广泛参与机构和企业致力投入,国内在理论研究和应用实践上都在不断提升,才赢来了与国际竞争对手步入并驾齐驱的阶段。但未来,仍然应加强国际间的合作交流,夯实技术基础,扩大产品适用范围,提升国产数据库产品的国际影响力。

希望收听完整音频对话内容的朋友,请移步【科技慢半拍】播客节目:

END