# 用户数据生成工具 ## 功能说明 这个Python脚本可以生成3000条符合导入模版格式的测试数据。 ## 生成的数据字段 - **信息编号(必填)**: 10000-12999 - **姓名(必填)**: 随机生成的中文姓名 - **监区(必填)**: 第一监区、第二监区、第三监区、A区、B区、C区、D区 - **性别**: 男/女 - **出生日期**: 1950-2005年之间 - **民族**: 汉、汉族、回族、满族、蒙古族、维吾尔族、苗族、壮族 - **文化程度**: 小学、初中、高中、中专、大专、本科、研究生 - **罪名**: 18种常见罪名(抢劫罪、盗窃罪、诈骗罪等) - **刑期**: 随机生成(X年/X月/无期) - **刑期起日**: 2015-2024年之间的随机日期 - **刑期止日**: 根据刑期起日和刑期长度计算 - **入监时间**: 与刑期起日相同 - **状态**: 在押 ## 安装依赖 ```powershell pip install -r requirements_data_generation.txt ``` 或者单独安装: ```powershell pip install pandas openpyxl ``` ## 运行脚本 ```powershell python generate_test_data.py ``` ## 输出文件 脚本运行后会在当前目录生成: - `用户导入测试数据_3000条.xlsx` - 包含3000条测试数据的Excel文件 ## 自定义生成数量 如需修改生成数量,请编辑脚本中的 `NUM_RECORDS` 变量: ```python NUM_RECORDS = 3000 # 修改为你需要的数量 ``` ## 数据示例 | 信息编号 | 姓名 | 监区 | 性别 | 出生日期 | 民族 | 文化程度 | 罪名 | 刑期 | 刑期起日 | 刑期止日 | 入监时间 | 状态 | |---------|------|------|------|---------|------|---------|------|------|---------|---------|---------|------| | 10000 | 张伟强 | 第一监区 | 男 | 1985-03-15 | 汉 | 高中 | 抢劫罪 | 5年 | 2020-01-10 | 2025-01-10 | 2020-01-10 | 在押 | | 10001 | 李芳娜 | A区 | 女 | 1992-08-22 | 汉族 | 本科 | 诈骗罪 | 3年 | 2022-05-20 | 2025-05-20 | 2022-05-20 | 在押 |