- 08 Apr, 2021 8 commits
-
-
Merlijn Wajer authored
-
Merlijn Wajer authored
-
Merlijn Wajer authored
-
Merlijn Wajer authored
-
Merlijn Wajer authored
-
Merlijn Wajer authored
-
Merlijn Wajer authored
-
Merlijn Wajer authored
-
- 06 Apr, 2021 2 commits
-
-
Merlijn Wajer authored
-
Merlijn Wajer authored
-
- 02 Apr, 2021 1 commit
-
-
Merlijn Wajer authored
-
- 24 Mar, 2021 2 commits
-
-
Merlijn Wajer authored
-
Merlijn Wajer authored
-
- 23 Mar, 2021 5 commits
-
-
Merlijn Wajer authored
-
Merlijn Wajer authored
-
Merlijn Wajer authored
Does not pass the ocr-fileformat validator yet (<tr> elements are unexpected)
-
Merlijn Wajer authored
We can re-use it when parsing tables (each cell is a block)
-
Merlijn Wajer authored
-
- 22 Mar, 2021 1 commit
-
-
Merlijn Wajer authored
-
- 19 Mar, 2021 4 commits
-
-
Merlijn Wajer authored
-
Merlijn Wajer authored
-
Merlijn Wajer authored
-
Merlijn Wajer authored
-
- 18 Mar, 2021 1 commit
-
-
Merlijn Wajer authored
-
- 16 Mar, 2021 2 commits
-
-
Merlijn Wajer authored
-
Merlijn Wajer authored
Will move most of the code to a separate parsing file later
-
- 15 Mar, 2021 2 commits
-
-
Merlijn Wajer authored
-
Merlijn Wajer authored
-
- 22 Feb, 2021 1 commit
-
-
Merlijn Wajer authored
-
- 21 Feb, 2021 1 commit
-
-
Merlijn Wajer authored
-
- 18 Feb, 2021 3 commits
-
-
Merlijn Wajer authored
-
Merlijn Wajer authored
The hocr-fold-chars fix requires a version bump
-
Merlijn Wajer authored
-
- 03 Feb, 2021 1 commit
-
-
Merlijn Wajer authored
This allows for gz support
-
- 02 Feb, 2021 5 commits
-
-
Merlijn Wajer authored
-
Merlijn Wajer authored
Will also return the word confidences for each page Also rename get_hocr_words to get_paragraph_hocr_words
-
Merlijn Wajer authored
-
Merlijn Wajer authored
-
Merlijn Wajer authored
-
- 26 Jan, 2021 1 commit
-
-
Merlijn Wajer authored
-