2020年全球新增226万乳腺癌患者,乳腺癌取代肺癌成为世界新发病例最多的恶性肿瘤。在中国,乳腺癌是发病率第一 、死亡率第四的恶性肿瘤,且呈年轻化趋势。
10月15日,2021中国乳腺癌诊疗能力项目高峰论坛在广州举行,会上透露了“中国乳腺癌标准数据库”的建设情况。
科学家们为什么要建设中国人的乳腺癌标准数据库?数据库收集了哪些数据?建成后将如何影响我们的健康?南方+记者采访了相关专家。

数据库要收集哪些数据?
去年10月,“乳腺癌单病种诊疗能力提升项目”启动,中国乳腺癌标准数据库开始建设。一年过去,该项目已签约27家医院,覆盖全国16个省份,数据库纳入总病例数超4万例,大部分数据来自2010年以后。
就任项目专家委员会主任委员的中国科学院院士、中山大学孙逸仙纪念医院院长宋尔卫介绍,近10年来我国乳腺癌的病例量已经很大,但数据没能得到很好的挖掘、分析和利用。“国外在早年已经意识到这个问题,有4个比较知名的数据库,都有数十年的建设历史。”
他表示,与国外早期纯文字、扁平化的数据库相比,我国布局的是多模态数据库,除了文字数据外,还涉及影像学资料,基因组学、蛋白组学分析等等,更为丰富立体,有助于让乳腺癌数据逐步走向规范、实用。
目前,数据库已经实现乳腺癌生存预测模型的构建与个性化治疗的辅助制定。同时,数据库的建设还带动了《乳腺癌临床科研病历标准数据集》《乳腺癌名词术语》两项标准的初步形成,确立起乳腺癌临床科研病历标准数据集内容规范、分类代码和数据元及其值域代码标准,共纳入19类数据元模块,378个不同字段。
中国人的乳腺癌标准数据库有什么用?
大数据是现代生活的基石之一。我们常用的地图软件、购物软件等,或多或少使用了大数据作为底层支撑。在医疗和科研领域,大数据同样重要。
在我国很多大城市,乳腺癌临床诊疗水平已经达到欧美发达国家重要肿瘤中心的水平,国内乳腺癌科研水平达到全球顶尖。“但‘高峰’有了,‘高原’还未见,我国还缺少一个全国性的、多维度的数据库。”山东大学第二医院副院长余之刚形象地说。
解放军总医院肿瘤医学部副主任、中国临床肿瘤学会(CSCO)副理事长兼秘书长江泽飞表示,很多基层医院的乳腺癌病例数不多,无法获取足够的病例以作临床研究的用途。“有国家数据库项目牵头,医院间可以实现数据共享、相互学习,国家在制订惠民政策、行业政策的时候也有了更多遵循。”
北京大学第一医院乳腺疾病中心主任、中华医学会外科学分会乳腺外科学组组长刘荫华也表示,建设乳腺癌数据库的出发点是国计民生,最终要为“健康中国2030”服务,“用中国人的数据,制定适合中国人的政策、指南。”

还有哪些瓶颈问题?
宋尔卫认为,数据库建设还有3方面瓶颈亟待突破。
首先是如何保证数据安全。宋尔卫透露:“我们在研究‘联邦学习’的模式,将其作为一个课题去研究。”其次,目前我国特别缺乏既有医学专业背景,又有互联网背景的交叉学科人才。最后,数据库的投入很大,如何实现长期运营、持续发展,也是建设方要考虑的问题。
宋尔卫表示,数据库计划每年遴选10个科研项目,将数据共享给这些项目使用,助力科研转化临床决策、政府政策分析等。
【记者】钟哲
【通讯员】林伟吟 张阳
订阅后可查看全文(剩余80%)