欢迎访问中南医学期刊社系列期刊网站!

深度学习运用于胸腔X射线影像研究的文献计量学分析

发表时间:2023年04月25日阅读量:2908次下载量:1321次下载手机版

作者: 黄夏璇 1, 2 陈咏梅 3 袁师其 1, 2 黄韬 2 何宁霞 2 吕军 2, 4

作者单位: 1. 暨南大学附属第一医院神经内科(广州 510630) 2. 暨南大学附属第一医院临床研究部(广州 510630) 3. 暨南大学学报编辑部(广州 510632) 4. 广东省中医药信息化重点实验室(广州 510632)

关键词: 深度学习 胸腔X射线影像 SCIE PubMed 文献计量学分析 新型冠状病毒肺炎

DOI: 10.12173/j.issn.1004-5511.202201031

基金项目: 基金项目: 广东省科技计划项目(2021B1212040007)

引用格式:黄夏璇, 陈咏梅, 袁师其, 黄韬, 何宁霞, 吕军. 深度学习运用于胸腔X 射线影像研究的文献计量学分析[J]. 医学新知, 2023, 33(2): 91-99. DOI: 10.12173/j.issn.1004-5511.202201031.

Huang XX, Chen YM, Yuan SQ, Huang T, He NX, Lyu J. Bibliometric analysis of deep learning in chest X-ray imaging research[J]. Yixue Xinzhi Zazhi, 2023, 33(2): 91-99. DOI: 10.12173/j.issn.1004-5511.202201031. [Article in Chinese]

摘要|Abstract

目的  基于SCIE和PubMed数据库了解深度学习在胸腔X射线影像相关领域研究文献发表情况。

方法  检索2017年1月1日至2021年12月31日收录于SCIE和PubMed的关于胸腔X射线影像的文献,针对发文量、出版机构、出版期刊、引文、作者及关键词等信息进行统计分析。

结果  共纳入文献440篇,深度学习在胸腔X射线影像研究相关文献发文量呈逐年增长趋势。美国发文量最多,总被引频次为4 409次,篇均被引频次为12.32次,美国的IEEE Access期刊发文量最多,达29篇。发文量排名第一的出版商是德国的Springer Nature,为83篇。核心作者7位,发文最多的有10篇,主要关键词频次出现最多的为COVID-19。

结论  SCIE和PubMed收录的关于深度学习在胸腔X射线影像相关领域的文献整体呈逐年上升趋势,基本以英文文献增长为主,核心作者群尚未形成,尚未出现引文量和发文量均丰富的领军人物,高影响力文献数量有限。

全文|Full-text

近年来,深度学习的计算机视觉技术逐渐成为人工智能领域的研究热点[1]。作为机器学习的领域之一,深度学习利用深度神经网络模拟人脑进行分析学习,获得特征表达[2]。2017年以来,深度学习逐渐与临床影像结合,图像分类检测系统在临床医学影像方面开始得到有效实践[3-4]。胸腔X射线影像是肺部和心血管疾病诊断和治疗的重要依据,但大量的数据和潜在的病理特征信息大幅降低了诊断的效率,而深度学习的出现及其与人工智能的结合有助于对医学图像进行特征提取和自动化分类,为提高诊断效率提供了发展方向[5]。本文拟对SCIE和PubMed收录的关于深度学习在胸腔X射线影像方面的研究进行梳理归纳并分析总结,以更好地了解国内外深度学习结合临床影像的研究热点及发展趋势,为进一步推动深度学习及其临床应用提供参考。

1 资料与方法

1.1 纳入与排除标准

纳入标准:①SCIE和PubMed数据库中已发表的与深度学习在胸腔X射线影像有关的文献[6-9] ;②发表时间为2017年1月1日至2021年12月31日。

排除标准:①研究主题仅为深度学习而与胸腔X射线影像无关的文献;②文献载体为图书、报纸、成果;③重复研究。

1.2 文献检索与数据来源

检索2017年1月1日至2021年12月31日收录于SCIE、PubMed数据库,与深度学习在胸腔X射线影像研究相关的文献,主要检索词为:Deep learning、Machine Learning、Transfer learning、chest X-rays*、CXR*。以PubMed为例,检索策略见框1。

  • 框图1 PubMed检索策略
    Box1.Search strategy in PubMed

1.3 文献筛选与资料提取

利用EndNote X7软件对检出的文献进行分类整理,去除重复文献。对检出文献研究年份、国家(地区)、研究机构、研究方向、作者、主题分类、来源出版物、高被引文献及论文总被引频次等信息进行提取。采用普赖斯曲线方程F(t)=a·ebt,揭示文献随时间增长的规律[10-12] 。

1.4 统计学分析

采用文献计量学方法进行分析,利用VOSviewer 1.6.17软件对高频关键词进行核心作者发文量分析和热点分析,生成可视化网络图[13]。对于核心作者关系图,设定作者最少发文数为2,并计算与其他作者之间合作连接的总强度,选择总连接强度最大的作者,颜色范围从蓝色至黄色,作者之间的合作程度越紧密则颜色越接近黄色。在关键词关系网络图中,每一个节点代表一个关键词,节点的圆圈直径越大则关键词出现的频次越高,不同关键词之间连接线越粗,表示两者之间的关系越紧密。通过Bibliometric[14]软件分析文献高频词,推测该领域研究热点,并基于所有文献分布的国家、作者,以及主要关键词构建交互式的桑基图,包含权重关系流向,线条的粗细代表关联的紧密程度,线条的颜色代表不同的流量大小。

2 结果

2.1 一般情况

检索获得相关文献717篇,其中SCIE 362篇、PubMed 355篇,根据纳排标准剔除不符合条件及重复发表文献,最终纳入文献440篇。文献类型以学术论文为主,共414篇(94.09%),其余为综述(17篇,3.86%)、会议摘要(8篇,1.82%)、社评(1篇,0.23%),提示学术论文是胸腔X射线影像深度学习研究成果的主要产出形式。

2.2 文献年载文量分布

对纳入文献发表年份和文献累计量分布情况进行分析,结果显示2017—2021年发文量呈逐年增长的趋势,2020—2021年论文数量增长幅度最大,近5年文献累积总量随年份呈指数增长,反映了SCIE和PubMed收录的与胸腔X射线影像有关的深度学习文献的总体发展趋势良好(图1)。

  • 图1 年累积文献发文量趋势
    Figure1.The trend of annual cumulative publications
    注:与C组比较,*P<0.05;与ALI组比较,#P<0.05;与Ir组比较,&P<0.05

2.3 文献来源国家/地区分布

纳入文献共涉及47个国家和地区,通过Bibliometric软件获得文献发表总量排名前15的国家/地区分布图(图2)。美国文献总量排名第一,占比约14.77%;中国位列其后,占比约14.09%;印度排名第三,占比约10.00%。大部分都是以与本国作者合作论文为主。

  • 图2 纳入文献的国家/地区分布
    Figure2.The country/district distribution of included publications

2.4 期刊载文量分布

图3展示了主要出版商的发文情况。德国的Springer Nature排名第一(83篇),其收录了大量关于SARS-CoV-2 与 COVID-19在胸腔X射线上深度学习的文章;其次为荷兰的Elsevier(74篇)、美国的IEEE(48篇)。发文量排名前十的期刊主要来自美国(4家)和英国(3家),对于深度学习的研究在国际上具有一定的贡献力和领先优势,发文量最多的期刊是美国的IEEE Access,共29篇,期刊排名情况详见表1。

  • 图3 出版商发文量分布
    Figure3.The publications distribution of related publishers
    注:与C组比较,*P<0.05;与ALI组比较,#P<0.05;与Ir组比较,&P<0.05

  • 表格1 期刊发文量前十统计
    Table1.Top ten statistics journals

2.5 文献作者分布

纳入文献的主要作者共2 438位,表2展示了发文量最多的7位作者的相关信息。发文量最大的是美国的Rajaraman S(10篇),被引频次最多的是美国的Duong Tim(8 848次),来自中国的作者Wang J发文5篇、被引频次为455。根据普赖斯定律计算得出核心作者最少发文量为2.37篇,即发表2篇及以上论文的作者入选核心作者候选人。核心作者发文总量相对较少,尚未出现引文量和发文量丰富的领军人物[15],详见图4。

  • 表格2 部分核心作者发文情况
    Table2.The publication information of core authors

  • 图4 核心作者关系热图
    Figure4.The heat map of core author relationship
    注:与C组比较,*P<0.05;与ALI组比较,#P<0.05;与Ir组比较,&P<0.05

2.6 文献关键词的可视化分析

对纳入文献的关键词进行分析,出现频次大于50次的主题词共有9个,其中COVID-19 (新型冠状病毒肺炎)出现160次,其次为Computer Science(计算机科学)143次、Engineering(工程)127次、Classificiation(分类)77次,参照关键词出现频次得到所有关键词之间的网络关系图,详见图5。通过Bibliometric软件分析文献高频词,目前深度学习在X射线影像学研究的热点趋势话题为重症COVID-19、图像分割、人工智能、迁移学习、卷积神经网络、特征提取等(图6)。本研究还将纳入文献的国家、作者及主要关键词作为三个过滤器,借助Bibliometric分析软件构建交互式的桑基图,其中,中国的主支宽度最大,除热点关键词外,与机器学习、卷积神经网络、人工智能、图像分类等关键词的关系紧密(图7)。

  • 图5 关键词关系网络图
    Figure5.Relational network graph of keywords
    注:与C组比较,*P<0.05;与ALI组比较,#P<0.05;与Ir组比较,&P<0.05

  • 图6 热点话题趋势图
    Figure6.The trend chart of hot topics
    注:与C组比较,*P<0.05;与ALI组比较,#P<0.05;与Ir组比较,&P<0.05

  • 图7 国家、作者及关键词桑基图
    Figure7.Sankey diagram of country, author and key words

3 讨论

本文基于SCIE和PubMed数据库,采用文献计量学分析方法,借助VOSviewer和Bibliometric分析软件,对近5年来胸腔X射线影像深度学习相关文献从发文量、作者、出版机构、关键词等方面进行了可视化分析,为进一步的研究提供参考。

既往文献指出学术性文献的增长一般分为四个阶段[16-17],即缓慢增长的初始阶段、指数增长阶段、线性增长阶段和缓慢增长阶段。深度学习作为机器学习的一个热门领域,近年来随着计算机视觉化和临床大数据学科交叉频繁,2017—2021年间胸腔X射线影像的深度学习文献数量呈现逐年增长的趋势,基本达到了指数增长的阶段,推测未来该领域发文量将呈现可观的态势。

通过分析纳入文献的国家/地区分布、被引频次、出版期刊与出版商等信息,本研究发现,深度学习在胸腔X射线影像的研究仍为近年临床学科交互学习的新兴领域[17];美国发文量最多,来自英国出版机构的影响力较大,体现了美国学者在基于胸腔X射线影像深度学习领域中研究参与度较高。中国论文占统计总文献的14.09%,反映中国在该研究领域初露头角,具有一定的研究水平,但总体文献影响力仍有待提升。

通过对核心作者关系的统计和分析,可以反映作者在胸腔X射线影像深度学习领域的影响力,包括发表的论文数、被引次数和发文量等。本研究结果显示,发文数量、被引频次排名第一的均为美国学者,总体上共同合作发表多篇文献的作者相对较少,可以初步判断该领域尚未形成主要的核心作者群[12]。从作者关系热图可以看出,同一国家的作者合作较为紧密,但是国际间作者合作明显较少,尚不利于提升该研究领域的影响力和参与性。基于此,国内学者应积极与其他国家学者合作交流,尤其是在COVID-19、人工智能等热门领域方面。

文献的关键词凝聚了一篇文献的主题,本研究发现胸腔X射线影像深度学习的热点研究方向集中于深度学习、X射线、COVID-19、分类、图像分割、工程、人工智能等方面。目前,COVID-19的诊疗仍是临床研究的主流问题,全球相关中英文文献发表量早已累计破万[18-20],而人工智能结合胸腔X射线影像诊断为COVID-19的研究方向提供了新思路。在深度学习方面,从关键词方面可以看出目前主要基于影像图像的分割和预测分类,包括通过计算机分割影像实现对疾病的诊断和分级,以及对图像进行目标区域的检测和良恶性分类等。目前,基于胸片的深度学习在COVID-19的应用是研究热点,未来随着深度学习应用于医学图像的不断完善和进步,深度学习将在更多的胸部疾病(如气胸、肺水肿、胸腔积液、肺癌等)得到广泛应用,成为临床诊断和治疗中不可或缺的工具。

本研究仍存在一定的局限性。一方面,仅对PubMed、SCIE两个数据库进行了检索,文献覆盖面可能不全。另一方面,从研究热度的角度分析,深度学习在胸片影像的应用相关研究近几年才出现,检索主题词和自由词的范围受限,仍待更加完善的检索方式以扩大检索范围提高查全率[13]。

参考文献|References

1.侯宇青阳, 全吉成, 王宏伟. 深度学习发展综述[J]. 舰船电子工程, 2017, 37(4): 59-111. [Hou YQY, Quan JC, Wang HW. Review of deep learning development[J]. Ship Electronic Engineering, 2017, 37(4): 59-111.] DOI: 10.3969/j.issn.1672-9730.2017.04.002.

2.高明旭, 李靖, 朱绪平, 等. 深度学习方法研究综述[J].中国科技信息, 2019, (10): 56-57. [Gao MX, Li J, Zhu XP, et al. A survey of research on deep learning methods[J]. China Science and Technology Information, 2019, (10): 56-57.] DOI: 10.3969/j.issn.1001-8972.2019. 10.018.

3.李莉, 黄韬, 王新宇, 等. 胸腔X射线影像数据库-MIMIC-CXR数据探索[J]. 中国循证心血管医学杂志, 2021, 13(6): 653-656, 660. [Li L, Huang T, Wang XY, et al. Thoracic X-ray image Database-MIMIC-CXR data exploration[J]. Chinese Journal of Evidence-Bases Cardiovascular Medicine, 2021, 13(6): 653-656, 660.] DOI: 10.3969/j.issn.1674-4055.2021.06.04.

4.刘栋, 李素, 曹志冬. 深度学习及其在图像物体分类与检测中的应用综述[J].计算机科学, 2016, (12): 20-30. [Liu D, Li S, Cao ZD. A review of deep learning and its applications in image object classification and detection[J]. Computer Science, 2016, (12): 20-30.] DOI: CNKI:SUN:JSJA.0.2016-12-004.

5.陈莹. 迁移学习: 教AI提取抽象知识[N]. 科技日报, 2018-1-8(8). [Chen Y. Transfer learning: teaching AI to extract abstract knowledge[N]. Science and Technology Daily, 2018-1-8(8).]

6.张诗乐.基于ESI和InCites数据库对我国科研论文产出力和学术影响力的统计分析[D]. 河南: 新乡医学院, 2015. [Zhang SY. The statistical analysis of outputs and academic impact about scientific papers in China based on ESI and InCites databases[D]. Henan: Xinxiang Medical University, 2015.]

7.康国光, 沈振锋, 徐跃进, 等. 学生满意度研究: 现状、演进路径及前沿——基于Web of Science数据库[J].现代情报, 2014, 34(8): 29-36, 41. [Kang GG, Shen ZF, Xu YJ, et al. The analysis of evolution pathway, research hotspots and research frontiers on student satisfaction——based on 1511 articles from Web of Science[J]. Modern Information, 2014, 34(8): 29-36, 41.] DOI: 10.3969/j.issn.1008-0821.2014.08.005.

8.董文军. 基于Web of Science及ESI的学科数据统计分析[J]. 情报杂志, 2009, 28(z1): 27-31. [Dong WJ. Statistical analysis of subject data based on Web of Science and ESI[J]. Journal of Intelligence, 2009, 28(z1): 27-31.] DOI: CNKI:SUN:QBZZ.0.2009-S1-008.

9.林芸峰, 田玲, 张宏梁, 等. PubMed数据库1998~2008年抗抑郁药文献剂量学分析[J]. 中国药房, 2010, 21(1): 90-92. [Lin YF, Tian L, Zhang HL, et al. Bibliometric analysis on antidepressive agents in PubMed database during 1998~2008[J]. China Pharmacy, 2010, 21(1): 90-92.] DOI: CNKI:SUN:ZGYA.0.2010-01-044.

10.万晓霞.近10年SCl人格心理学研究文献计量分析[J]. 心理科学进展, 2009, 17(6): 1281-1286. [Wan XX. Research of personality psychology bibliometric analysis based on the database of SCI in recent ten years[J]. Advances in Psychological Science, 2009, 17(6): 1281-1286.] DOI: CNKI:SUN:XLXD.0.2009-06-024.

11.胡臻,张阳. 基于普赖斯定律与综合指数法的核心作者和扩展核心作者分析——以《西南民族大学学报》(自然科学版)为例[J].西南民族大学学报(自然科学版), 2016, 42(3): 351-354. [Hu Z, Zhang Y. Analysis of core authors and extended core authors based on price law and comprehensive index method——Take Journal of Southwest University for Nationalities (Natural Science Edition) for example[J]. Journal of Southwest University for Nationalities (Natrual Science Edition), 2016, 42(3): 351-354.] DOI: 10.11920/xnmdzk.2016.03.019.

12.郑彩琴, 陈小清, 黄笑云, 等. 基于PubMed、SCIE数据库国内医用红外热成像相关研究的文献计量学分析[J]. 中国医学影像学杂志, 2021, 29(7): 751-755. [Zheng CQ, Chen XQ, Huang XY, et al. Bibliometric analysis of medical infrared thermal imaging in China based on PubMed and SCIE databases[J]. Chinese Journal of Medical Imaging, 2021, 29(7): 751-755.] DOI: 10.3969/j.issn.1005-5185.2021.07.023.

13.王贝,刘纯青. 基于 Citespace 与 VOSviewer的国内生态网络研究[J]. 环境科学与管理, 2021, 46(4): 53-58. [Wang B, Liu CQ. Review on domestic ecological network research based on bibliometrics[J]. Environmental Science and Management, 2021, 46(4): 53-58.] DOI: 10.3969/j.issn.1673-1212.2021.04.016.

14.Tian DQ. Bibliometric analysis of pathogenic organisms[J]. Biosafety and Health, 2020, 2(2): 95-103. DOI: 10.1016/j.bsheal.2020.05.004.

15.梁立锋,曾紫云,邹玉如, 等.基于中国知网数据库的深度学习文献计量分析[J]. 岭南师范学院学报, 2020, 41(2): 118-123. [Liang LF, Zeng ZY, Zou YR, et al. Bibliometric analyses of deep learning research based on CNKI[J]. Journal of Lingnan Normal University, 2020, 41(2): 118-123.] DOI: 10.3969/j.issn.1006-4702. 2020.02.015.

16.石建, 石苗茜. 基于SCI及ESI的脑膜炎研究十年发展态势的文献计量分析[J]. 科学技术与工程, 2010, 10(30): 7396-7401. [Shi J, Shi MQ. 10 year bibliometrics quantitative analysis of development situation for meningitis study based on SCI and ESI[J]. Science Technology and Engineering, 2010, 10(30): 7396-7401.] DOI: 10.3969/j.issn.1671-1815.2010.30.005.

17.邱均平. 信息计量学[M]. 武汉: 武汉大学出版社, 2007. [Qiu JP. Informatics[M]. Wuhan: Wuhan University Press, 2007.]

18.王高玉, 刘红宁, 赵益.基于SCIE中医药研究十年发展态势文献计量分析[J]. 江西中医药大学学报, 2016, 28(6): 111-115. [Wang GY, Liu HN, Zhao Y. Research on the development of Chinese medicine based on SCIE for ten years[J]. Journal of Jiangxi University of Traditional Chinese Medicine, 2016, 28(6): 111-115.] DOI: CNKI:SUN:XYXB.0.2016-06-037.

19.张泽华, 郭姗姗, 赵志刚, 等.基于CiteSpace的新冠肺炎研究文献计量分析[J]. 中国医院药学杂志, 2020, 40(19): 2029-2034. [Zhang ZH, Guo SS, Zhao ZG, et al. Bibliometric analysis of COVID-19 based on CiteSpace[J]. Chinese Journal of Hospital Pharmacy, 2020, 40(19): 2029-2034.] DOI: 10.13286/j.1001-5213.2020.19.05.

20.张欣桐, 刘景卓, 李盼, 等. 重症新型冠状病毒肺炎的文献计量和可视化分析[J]. 中国急救医学, 2021, 41(4): 335-340. [Zhang XT, Liu JZ, Li P, et al. The bibliometrics and visualization analysis in the assessment of severe coronavirus disease 2019[J]. Chinese Journal of Critical Care Medicine, 2021, 41(4): 335-340.] DOI: 10.3969/j.issn.1002-1949.2021.04.012.

《医学新知》由国家新闻出版总署批准,中国农工民主党湖北省委主管,武汉大学中南医院和中国农工民主党湖北省委医药卫生工作委员会主办的综合性医学学术期刊,国内外公开发行。

官方公众号

扫一扫,关注我们