xinli/数据生成说明.md
2025-12-02 15:12:55 +08:00

1.9 KiB
Raw Blame History

用户数据生成工具

功能说明

这个Python脚本可以生成3000条符合导入模版格式的测试数据。

生成的数据字段

  • 信息编号(必填): 10000-12999
  • 姓名(必填): 随机生成的中文姓名
  • 监区(必填): 第一监区、第二监区、第三监区、A区、B区、C区、D区
  • 性别: 男/女
  • 出生日期: 1950-2005年之间
  • 民族: 汉、汉族、回族、满族、蒙古族、维吾尔族、苗族、壮族
  • 文化程度: 小学、初中、高中、中专、大专、本科、研究生
  • 罪名: 18种常见罪名抢劫罪、盗窃罪、诈骗罪等
  • 刑期: 随机生成X年/X月/无期)
  • 刑期起日: 2015-2024年之间的随机日期
  • 刑期止日: 根据刑期起日和刑期长度计算
  • 入监时间: 与刑期起日相同
  • 状态: 在押

安装依赖

pip install -r requirements_data_generation.txt

或者单独安装:

pip install pandas openpyxl

运行脚本

python generate_test_data.py

输出文件

脚本运行后会在当前目录生成:

  • 用户导入测试数据_3000条.xlsx - 包含3000条测试数据的Excel文件

自定义生成数量

如需修改生成数量,请编辑脚本中的 NUM_RECORDS 变量:

NUM_RECORDS = 3000  # 修改为你需要的数量

数据示例

信息编号 姓名 监区 性别 出生日期 民族 文化程度 罪名 刑期 刑期起日 刑期止日 入监时间 状态
10000 张伟强 第一监区 1985-03-15 高中 抢劫罪 5年 2020-01-10 2025-01-10 2020-01-10 在押
10001 李芳娜 A区 1992-08-22 汉族 本科 诈骗罪 3年 2022-05-20 2025-05-20 2022-05-20 在押