address字段内部分布.jsonconfig.json 结构如下,其中fields为各字段内部分布、pattern为地址模式分布。
将 address字段内部分布.json粘贴进config.json 中filed;
详细字段人工检查,增删改查,形成最终的配置文件new_config.json
{
"version": [
"0.1.0 init",
"0.1.1 增加label路径",
"0.1.2 修改部分名字",
"0.1.3 去除label文件路径, label内容由field中的name来定义",
"0.1.4 大重构, 大大降低配置档的难度",
"0.1.5 增加模版和实际分布"
],
"totalCount": 100000,
"shuffle": true,
"outputFile": "./data/datas.json",
"outputFileHuman": "./data/datas_human.txt",
"fields":[...]
"pattern":[...]
}
位置:【main.py】
new_config.json 、各字段候选集train.json 、test.json 、data_human.txt(方便阅读的造的地址)执行 main.py,生成训练集和测试集。