创建此合成医疗保健数据集的目的是为数据科学、机器学习和数据分析爱好者提供宝贵的资源。该数据集旨在模拟现实世界的医疗保健数据,允许用户在医疗保健领域的背景下练习、发展和展示数据处理和分析技能。通过合成数据,用户可以进行多种分析任务而无需担心隐私或敏感性问题。
本数据集包含五万多条数据,创建此医疗保健数据集的目的是为数据科学、机器学习和数据分析爱好者提供宝贵的资源。该数据集旨在模拟现实世界的医疗保健数据,允许用户在医疗保健领域的背景下练习、发展和展示数据处理和分析技能。通过合成数据,用户可以进行多种分析任务而无需担心隐私或敏感性问题。
数据应用范围:
医疗保健预测建模:例如,预测患者的住院天数、医疗费用或疾病发生的概率。
数据清理与预处理:练习数据清理、转换和处理技术。
数据分析与可视化:探索和可视化医疗趋势,识别常见的医疗条件或医疗服务类型。
机器学习模型:针对多类分类问题,特别是对测试结果进行分类(正常、异常、不确定)。
医疗保险分析:分析不同保险提供商和政策下的费用趋势和医疗状况。
| 姓名 | 与医疗记录相关的患者姓名 |
| 年龄 | 患者入院时的年龄(以岁为单位) |
| 性别 | 患者的性别(“男”或“女”) |
| 血型 | 患者的血型(如“A+”、“O-”等) |
| 医疗状况 | 患者的主要医疗状况或诊断(如“糖尿病”、“高血压”、“哮喘”等) |
| 入院日期 | 患者入院的日期 |
| 医生 | 负责患者护理的医生姓名 |
| 医院 | 患者入院的医疗机构或医院 |
| 保险提供商 | 患者的保险提供商(如“Aetna”、“Blue Cross”、“Cigna”等) |
| 账单金额 | 患者在入院期间医疗服务的费用 |
| 房间号 | 患者入院时住宿的房间号 |
| 入院类型 | 入院类型(如“紧急”、“选修”或“加急”) |
| 出院日期 | 患者从医疗机构出院的日期 |
| 药物 | 患者入院期间使用的药物(如“阿司匹林”、“布洛芬”、“青霉素”等) |
| 检测结果 | 患者在入院期间进行的医学检测结果(如“正常”、“异常”或“不确定”) |


