Canregtools: 基于R语言的人群肿瘤登记数据分析工具包
中文论文
第一作者
目的
开发一款名为 canregtools 的 R 语言包,用于人群肿瘤登记(Population-Based Cancer Registration, PBCR)的数据分析、可视化与报告生成,以简化和促进全国 PBCR 数据分析与应用。
方法
本研究基于 R 语言开发了一个免费开源的 R 语言包。该工具基于S3类的泛函数概念开发相关功能,为不同的数据类型定义对应的S3类,从而实现相同函数在不同S3类对象上的功能多样化。该工具主要通过五类函数实现数据读取、数据处理、统计计算、可视化和统计报告等功能。本研究利用该工具包汇总分析多个肿瘤登记处的发病、死亡和人口数据,输出汇总统计结果。
结果
Canregtools 主要包含五类函数,分别为数据读取、数据处理、统计计算、可视化和统计报告。数据读取功能支持读取中国国家癌症中心要求上报的数据格式;数据处理功能包括年龄分组、ICD-10分类、儿童肿瘤分类、人口数估计及简略寿命表扩展等;统计计算功能包括年龄标化率、截缩率、累积率、累积风险、寿命表以及将简略寿命表扩展为完全寿命表等功能;可视化功能可以绘制人口金字塔图、条形图、线图等人群肿瘤登记常规统计常用统计图形;统计报告功能则把统计指标、图表以及文字描述整合为综合的肿瘤登记报告。
结论
本研究基于S3类泛函数的概念,开发了一款名为 canregtools 的 R 语言工具包。该工具包具有免费、开源和高效的特点,可通过规范化的数据处理流程满足多样化的肿瘤登记数据分析、可视化及报告生成需求,从而助力肿瘤登记处的常规统计工作顺利开展。
【关键词】 软件; R语言包; 人群肿瘤登记; 数据分析
【基金项目】河南省科技攻关项目(232102310166)