xinli/数据生成说明.md
2025-12-02 15:12:55 +08:00

56 lines
1.9 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 用户数据生成工具
## 功能说明
这个Python脚本可以生成3000条符合导入模版格式的测试数据。
## 生成的数据字段
- **信息编号(必填)**: 10000-12999
- **姓名(必填)**: 随机生成的中文姓名
- **监区(必填)**: 第一监区、第二监区、第三监区、A区、B区、C区、D区
- **性别**: 男/女
- **出生日期**: 1950-2005年之间
- **民族**: 汉、汉族、回族、满族、蒙古族、维吾尔族、苗族、壮族
- **文化程度**: 小学、初中、高中、中专、大专、本科、研究生
- **罪名**: 18种常见罪名抢劫罪、盗窃罪、诈骗罪等
- **刑期**: 随机生成X年/X月/无期)
- **刑期起日**: 2015-2024年之间的随机日期
- **刑期止日**: 根据刑期起日和刑期长度计算
- **入监时间**: 与刑期起日相同
- **状态**: 在押
## 安装依赖
```powershell
pip install -r requirements_data_generation.txt
```
或者单独安装:
```powershell
pip install pandas openpyxl
```
## 运行脚本
```powershell
python generate_test_data.py
```
## 输出文件
脚本运行后会在当前目录生成:
- `用户导入测试数据_3000条.xlsx` - 包含3000条测试数据的Excel文件
## 自定义生成数量
如需修改生成数量,请编辑脚本中的 `NUM_RECORDS` 变量:
```python
NUM_RECORDS = 3000 # 修改为你需要的数量
```
## 数据示例
| 信息编号 | 姓名 | 监区 | 性别 | 出生日期 | 民族 | 文化程度 | 罪名 | 刑期 | 刑期起日 | 刑期止日 | 入监时间 | 状态 |
|---------|------|------|------|---------|------|---------|------|------|---------|---------|---------|------|
| 10000 | 张伟强 | 第一监区 | 男 | 1985-03-15 | 汉 | 高中 | 抢劫罪 | 5年 | 2020-01-10 | 2025-01-10 | 2020-01-10 | 在押 |
| 10001 | 李芳娜 | A区 | 女 | 1992-08-22 | 汉族 | 本科 | 诈骗罪 | 3年 | 2022-05-20 | 2025-05-20 | 2022-05-20 | 在押 |