科技自强,深圳担当⑤|深算院:崖山、采石矶与钓鱼城背后的“新突围”

南方+ 记者

/  南方+ 王玮 拍摄

进入栏目>>> 科技自强 深圳担当

提到IT领域的“卡脖子”,人们往往会想到“缺芯少魂”。“芯”指芯片,“魂”指操作系统、数据库等核心基础软件。与芯片相比,大众对基础软件的感知更弱,“重硬件、轻软件”的观点在市场上也并不鲜见,但基础软件一旦被“卡脖子”,将直观影响人们的工作和生活,因此安全可控、核心原创的基础软件尤为重要。

记者近日采访获悉,在深圳市龙华区,2019年揭牌的深圳计算科学研究院(简称“深算院”)由国际知名院士科学家领衔,将原创理论落地转化为实用系统,致力于打造中国原创的基础软件品牌,助力国家解决关键领域“卡脖子”难题。

截至目前,该院已开发并落地三款全自研的战略性基础软件产品——崖山数据库系统、采石矶数据质量系统、钓鱼城数据分析系统,并在多个重点行业领域落地应用。


深算院借鉴贝尔实验室模式,采取“理论+工程”的研发运行体系。  南方+ 王玮 拍摄

作为深圳市政府2018年批准建设的“十大基础研究机构”之一,深算院的最大特点是打造了具有产品能力的基础研究机构。该院借鉴贝尔实验室模式,采取“理论+工程”的研发运行体系,拥有一支世界一流的青年科学家团队,将科研成果用于解决产业难题,还拥有一支研发实力堪比硅谷、占比超八成的工程团队,以特色人才体系实现创新成果的快速转化。

造中国原创基础软件品牌

走进位于深圳龙华区科技创新中心的深算院,“崖山”“采石矶”“钓鱼城”这三个数据库系统的名字让人印象深刻。

深算院崖山DB研发总监欧伟杰介绍,“崖山”“采石矶”“钓鱼城”均由深算院首席科学家根据南宋三场保家卫国之战命名。

据了解,崖山海战是南宋灭亡的悲壮一战,代表着国产基础软件目前的危机情况,而采石矶之战讲的是虞允文以少胜多的历史典故,代表打造产品的决心和信心,钓鱼城代表的是对抗外敌时的坚持顽强。通过三个历史战争的典故,意在国产基础软件面临强大挑战的情况下实现以全自研的技术和系统,突破数据库系统领域关键核心技术,彰显背水一战的决心和毅力。

欧伟杰告诉记者,数据库管理系统(DataBase Management System,简称DBMS)是存储、管理和使用数据的基础软件,被全球各行各业广泛使用。数据库系统与操作系统、中间件并称为基础软件“三驾马车”,被誉为基础软件“皇冠上的明珠”,是信息化、智能化、数字化发展的“底座”。

深算院崖山DB研发总监欧伟杰。  南方+ 王玮 拍摄

崖山数据库系统是深算院自主设计研发的新型数据库管理系统,融入原创的有界计算、近似计算、并行可扩展及跨模融合理论,不基于任何开源数据库软件二次包装和开发。

“2022年,崖山数据库系统获得了内核代码自主率100%的测试结果,在国内是凤毛麟角的。”欧伟杰告诉记者,崖山数据库系统实现了从底层理论到系统工程的全链条基础软件研发,真正掌握核心技术。

欧伟杰拥有10年以上数据库内核设计与开发经验。2019年,他加入深算院,组建团队,专注从事数据库工作。

“比方说市场上打造一个发动机,尽管可以将零部件交给其他厂商去做,但这样做难以把控发动机持续稳定高性能的运行,而我们在开发全自研基础软件的过程中,不基于开源自建,相当于所有原材料、零部件等全部自己研发、生产,要从数据库未来的演进去深入思考、构建。”欧伟杰告诉记者,“从0到1”开发一款数据库难度非常大,通常需要较长的周期,但面对的需求却很紧迫,崖山数据库系统团队依托研究院原创先进理论和工程团队技术积累,在较短时间周期内完成了产品的研发。

今年,崖山数据库系统正式推出被称为数据领域技术“制高点”的共享集群技术,在高可用性、高扩展性、高性能等方面取得了突破,为国产数据库在金融、运营商等国计民生领域的应用奠定了基础。

深算院展厅的论文墙。  南方+ 王玮 拍摄

创新“理论+工程”双轨制

数据库系统被誉为计算产业之“根”。说起做数据库,懂行的人没人会觉得能轻易成功的事,尤其是全自研数据库,既需要科学家们来做创新,又需要工程师们一行行代码高质量实现,最后还需要根据客户场景不断磨合、优化、试错、改进,商用的周期较长。

引人注目的是,崖山数据库系统起步2019年,到2022年完成“从0到1”的产品打磨,并经权威机构测试,核心代码自主率100%,突破了自主可控核心技术。2023年则着力将产品推向市场,进入“从1到10”的过程。

目前,崖山数据库系统已兼容适配国内主流软硬件生态环境,在金融、政企、能源、交通、大型央国企集团、线上零售等领域进行了深度的应用和推广。以能源领域为例,某燃气集团的客户信息管理系统原先采用某国外主流数据库系统,面临着数据量大、扩展困难,运维低效等问题,后选用崖山数据库系统实现无缝迁移,性能和成本方面均取得了明显收益。

在欧伟杰看来,崖山数据库系统的快速成长,来自于团队积累多年的理论基础、工程实现能力,尤其是深算院“理论+工程”兵团式作战的运行体系。

作为一个有产品能力的基础研究机构,深算院利用多重渠道开展全球引才,在吸引人才时就注重吸收科学家和工程师。截至2023年5月,深算院已汇聚了一批科学家和优秀工程人员,其中工程团队占比超八成,这种特色人才体系可实现创新成果的快速转化。

据深算院研究团队介绍,深圳计算科学研究院介于企业和大学之间,目的是将研究成果直接转换成工业化系统,尤其是像数据管理这样的“卡脖子”技术。

“与高校的区别在于,我们拥有几支经验丰富、在国内首屈一指的工程团队,可以把研究成果直接转化为工业级系统,这在大学很难实现。与企业不同的是,我们有一支研究团队,直接解决工业界工程实施过程中遇到的问题,并从中抽象出研究课题。”

在欧伟杰看来,在数据库系统研发过程中,崖山数据库系统团队能够不被商业利益左右,研究人员会更关注研究成果如何转化,工程师不只“低头赶路”,也有相对宽松的环境”抬头看路”,两个团队经常交互。

他举例说,对于数据库研发过程中遇到的一些难点,研发人员可以协同工程师团队一起判断哪条路径更有保证;工程团队也可以快速验证研发人员提出的一些理论尝试。

截至2023年7月,深算院已累计在国际顶级期刊/会议发表/录用论文85篇,学术成果比肩国际顶尖大数据研究团队,且学术研究注重瞄准产业界实际难点,能将理论成果转化成为产业界实用系统,聚焦数据库系统、数据质量和数据价值三个研究方向,为IT界提供领先自主、拥有根技术的原创产品和解决方案。

攻坚“卡脖子”难题,创新产业生态

凭借多年的原创基础理论积累和在软件研发领域的实战经验,深算院团队深知关键技术“要不来、买不来、讨不来”,唯有把关键技术牢牢掌握在自己手里,才能实现科技的自立自强。

欧伟杰表示:“实现高水平科技自立自强,是科研工作者科技强国的使命和担当。作为科研工作者,应该艰苦奋斗,力争关键领域核心技术突破,在科技竞争的主战场抢占制高点,为建设科技强国、为我国高质量发展贡献源头创新力量。”

得益于深圳“双区驱动”的重大历史机遇、优质的创新土壤、良好的“产学研用”生态基础,优质的营商环境以及一流的企业发展配套服务,深算院正在朝着建设世界一流的计算科学基础研究机构的目标,在以新模式和新速度高速稳健发展。

与此同时,深算院也大力推动基础软件产业生态繁荣发展,助力科技强国和数字中国建设。

和芯片半导体领域一样,基础软件产业发展需要长时间积累,也需要繁荣的基础软件生态。

欧伟杰告诉记者:“得益于我国市场快速涌现的大量需求和近十年软件人才的持续培养,我们在应用软件开发和具体行业落地都是比较领先的,而软件理论研究和基础软件系统实现上目前还存在短板。”

他认为,缺乏原创理论突破和软件工程能力积累不足,一方面是前沿理论如何快速工程落地的产品化路径尚不清晰,另一方面则是关键人才储备有待提高, 大部分从业人员仍停留在应用开发层面, 对于基础软件的理解不够深入,工程能力也不系统。

以数据库为例,目前人才的供给跟不上业务诉求是普遍认知,对行业发展造成了一定程度的阻碍,进而拉长了技术成熟的周期。如果能为有志于从事基础软件的年轻人提供有效的学习渠道,给他们送一把“梯子”,既能帮助他们度过前期非常陡峭的学习曲线、走上感兴趣的赛道,也能为行业提供更多优秀人才。

欧伟杰说:“软件行业最核心的资产就是人,国产数据库内核研发设计人才尤其稀缺。我们做成一个产品的同时,最重要的结果除了产品本身,那就是带出一个成熟的团队。”

目前,深算院正在与多所高校合作,将自身积累多年的理论与工程经验对外输出,以提供数据库内核课程等方式为年轻人“搭梯子”。“我们希望深圳能培养和吸引更多有志从事基础软件的年轻人才,让更多人了解到行业发展的前景和机遇。”欧伟杰说。

【相关报道】

1、科技自强,深圳担当①|深港脑院:深港携手,探索生命科学“终极疆域”

2、科技自强,深圳担当②|深圳量子院:在科学花园深挖,播下科研种子开出产业花

3、科技自强,深圳担当③|深圳电子材料院:从需求端凝炼“根问题”,做高端电子材料“领跑者”

4、科技自强,深圳担当④|深圳合成院:一个“脑袋”通盘考虑科研+产业

【策划】杨磊

【采写】南方+记者 马芳

【摄影】王玮

编辑 程德坤
+1
您已点过

订阅后可查看全文(剩余80%)

更多精彩内容请进入频道查看

还没看够?打开南方+看看吧
立即打开