10.1 各字段值结合

10.2 数据生成配置文件

config.json 结构如下,其中fields为各字段内部分布、pattern为地址模式分布。

address字段内部分布.json粘贴进config.json 中filed;

详细字段人工检查,增删改查,形成最终的配置文件new_config.json

{
  "version": [
    "0.1.0 init",
    "0.1.1 增加label路径",
    "0.1.2 修改部分名字",
    "0.1.3 去除label文件路径, label内容由field中的name来定义",
    "0.1.4 大重构, 大大降低配置档的难度",
    "0.1.5 增加模版和实际分布"
  ],
  "totalCount": 100000,
  "shuffle": true,
  "outputFile": "./data/datas.json",
  "outputFileHuman": "./data/datas_human.txt",
  "fields":[...]
	"pattern":[...]
}

10.3.生成指定条数据量

位置:【main.py

执行 main.py,生成训练集和测试集。