从同事的一堆json文件中提取英语试题信息,这json槽点满满:
1、字段不统一,这套试卷的题目有【score】分数字段,到了下一套,他就把该字段省略了;
2、字段的值的含义不规范,比如阅读理解的文章,使用【“ ”】作为段落的分隔符,结果到了下一套,段落分隔符又变成了【NULL】;
3、json文件本身格式不统一,有的有BOM,有的没BOM,害我得统一去除BOM;
4、试题内容收录得也不规范,都使用【“ ”】作为段落的分隔符了,上一句文本得末尾居然还加【\n】,而且是部分试卷有,部分试卷没有。
5、然后针对近20种题型,每种题型写一套处理逻辑,真酸爽。
1、字段不统一,这套试卷的题目有【score】分数字段,到了下一套,他就把该字段省略了;
2、字段的值的含义不规范,比如阅读理解的文章,使用【“ ”】作为段落的分隔符,结果到了下一套,段落分隔符又变成了【NULL】;
3、json文件本身格式不统一,有的有BOM,有的没BOM,害我得统一去除BOM;
4、试题内容收录得也不规范,都使用【“ ”】作为段落的分隔符了,上一句文本得末尾居然还加【\n】,而且是部分试卷有,部分试卷没有。
5、然后针对近20种题型,每种题型写一套处理逻辑,真酸爽。