xinli/数据生成说明.md

56 lines
1.9 KiB
Markdown
Raw Normal View History

2025-12-02 15:12:55 +08:00
# 用户数据生成工具
## 功能说明
这个Python脚本可以生成3000条符合导入模版格式的测试数据。
## 生成的数据字段
- **信息编号(必填)**: 10000-12999
- **姓名(必填)**: 随机生成的中文姓名
- **监区(必填)**: 第一监区、第二监区、第三监区、A区、B区、C区、D区
- **性别**: 男/女
- **出生日期**: 1950-2005年之间
- **民族**: 汉、汉族、回族、满族、蒙古族、维吾尔族、苗族、壮族
- **文化程度**: 小学、初中、高中、中专、大专、本科、研究生
- **罪名**: 18种常见罪名抢劫罪、盗窃罪、诈骗罪等
- **刑期**: 随机生成X年/X月/无期)
- **刑期起日**: 2015-2024年之间的随机日期
- **刑期止日**: 根据刑期起日和刑期长度计算
- **入监时间**: 与刑期起日相同
- **状态**: 在押
## 安装依赖
```powershell
pip install -r requirements_data_generation.txt
```
或者单独安装:
```powershell
pip install pandas openpyxl
```
## 运行脚本
```powershell
python generate_test_data.py
```
## 输出文件
脚本运行后会在当前目录生成:
- `用户导入测试数据_3000条.xlsx` - 包含3000条测试数据的Excel文件
## 自定义生成数量
如需修改生成数量,请编辑脚本中的 `NUM_RECORDS` 变量:
```python
NUM_RECORDS = 3000 # 修改为你需要的数量
```
## 数据示例
| 信息编号 | 姓名 | 监区 | 性别 | 出生日期 | 民族 | 文化程度 | 罪名 | 刑期 | 刑期起日 | 刑期止日 | 入监时间 | 状态 |
|---------|------|------|------|---------|------|---------|------|------|---------|---------|---------|------|
| 10000 | 张伟强 | 第一监区 | 男 | 1985-03-15 | 汉 | 高中 | 抢劫罪 | 5年 | 2020-01-10 | 2025-01-10 | 2020-01-10 | 在押 |
| 10001 | 李芳娜 | A区 | 女 | 1992-08-22 | 汉族 | 本科 | 诈骗罪 | 3年 | 2022-05-20 | 2025-05-20 | 2022-05-20 | 在押 |