148 lines
2.3 KiB
Plaintext
148 lines
2.3 KiB
Plaintext
|
|
{
|
||
|
|
"$schema": "http://json-schema.org/draft-04/schema#",
|
||
|
|
"type": "object",
|
||
|
|
"javaType": "com.sequencelogic.sleds.models.ocr.OCROutput",
|
||
|
|
"properties": {
|
||
|
|
"numPages": {
|
||
|
|
"type": "integer"
|
||
|
|
},
|
||
|
|
"numBadPages": {
|
||
|
|
"type": "integer"
|
||
|
|
},
|
||
|
|
"originalSourceFile": {
|
||
|
|
"type": "string"
|
||
|
|
},
|
||
|
|
"originalSourceType": {
|
||
|
|
"type": "string",
|
||
|
|
"enum": ["PDF_IMG","TIF_IMG"]
|
||
|
|
},
|
||
|
|
"textSourceType": {
|
||
|
|
"type": "string",
|
||
|
|
"enum": ["NUANCE", "PrimeOCR", "PDF", "GnuOCR", "Unknown"]
|
||
|
|
},
|
||
|
|
"fixedUp": {
|
||
|
|
"type": "boolean"
|
||
|
|
},
|
||
|
|
"pages": {
|
||
|
|
"type": "array",
|
||
|
|
"items": {
|
||
|
|
"$ref": "#/definitions/OCRPage"
|
||
|
|
}
|
||
|
|
}
|
||
|
|
},
|
||
|
|
"definitions": {
|
||
|
|
"OCRPage": {
|
||
|
|
"definitions": {
|
||
|
|
"Line": {
|
||
|
|
"type": "object",
|
||
|
|
"javaType": "com.sequencelogic.sleds.models.ocr.Line",
|
||
|
|
"properties": {
|
||
|
|
"line": {
|
||
|
|
"type": "integer"
|
||
|
|
},
|
||
|
|
|
||
|
|
"zone": {
|
||
|
|
"type": "integer"
|
||
|
|
},
|
||
|
|
|
||
|
|
"page": {
|
||
|
|
"type": "integer"
|
||
|
|
},
|
||
|
|
|
||
|
|
"xmin": {
|
||
|
|
"type": "integer"
|
||
|
|
},
|
||
|
|
|
||
|
|
"ymin": {
|
||
|
|
"type": "integer"
|
||
|
|
},
|
||
|
|
|
||
|
|
"xmax": {
|
||
|
|
"type": "integer"
|
||
|
|
},
|
||
|
|
|
||
|
|
"ymax": {
|
||
|
|
"type": "integer"
|
||
|
|
},
|
||
|
|
|
||
|
|
"numChars": {
|
||
|
|
"type": "integer"
|
||
|
|
},
|
||
|
|
|
||
|
|
"chars": {
|
||
|
|
"type": "string"
|
||
|
|
},
|
||
|
|
|
||
|
|
"confs": {
|
||
|
|
"type": "string"
|
||
|
|
},
|
||
|
|
|
||
|
|
"xmins": {
|
||
|
|
"type": "array",
|
||
|
|
"items": {
|
||
|
|
"type": "integer"
|
||
|
|
}
|
||
|
|
},
|
||
|
|
|
||
|
|
"ymins": {
|
||
|
|
"type": "array",
|
||
|
|
"items": {
|
||
|
|
"type": "integer"
|
||
|
|
}
|
||
|
|
},
|
||
|
|
|
||
|
|
"xmaxs": {
|
||
|
|
"type": "array",
|
||
|
|
"items": {
|
||
|
|
"type": "integer"
|
||
|
|
}
|
||
|
|
},
|
||
|
|
|
||
|
|
"ymaxs": {
|
||
|
|
"type": "array",
|
||
|
|
"items": {
|
||
|
|
"type": "integer"
|
||
|
|
}
|
||
|
|
}
|
||
|
|
},
|
||
|
|
"required": [
|
||
|
|
"line",
|
||
|
|
"page",
|
||
|
|
"chars",
|
||
|
|
"numChars",
|
||
|
|
"confs"
|
||
|
|
]
|
||
|
|
}
|
||
|
|
},
|
||
|
|
|
||
|
|
"type": "object",
|
||
|
|
"javaType": "com.sequencelogic.sleds.models.ocr.OCRPage",
|
||
|
|
"properties": {
|
||
|
|
"page": {
|
||
|
|
"type": "integer"
|
||
|
|
},
|
||
|
|
"numLines": {
|
||
|
|
"type": "integer"
|
||
|
|
},
|
||
|
|
"lines": {
|
||
|
|
"type": "array",
|
||
|
|
"items": {
|
||
|
|
"$ref": "#/definitions/Line"
|
||
|
|
}
|
||
|
|
}
|
||
|
|
}
|
||
|
|
},
|
||
|
|
"required": [
|
||
|
|
"page",
|
||
|
|
"numLines",
|
||
|
|
"lines"
|
||
|
|
]
|
||
|
|
},
|
||
|
|
"required": [
|
||
|
|
"numPages",
|
||
|
|
"originalSourceFile",
|
||
|
|
"originalSourceType",
|
||
|
|
"pages",
|
||
|
|
"numBadPages"
|
||
|
|
]
|
||
|
|
}
|