是的,可以直接输出json,我就是这么做日语语法书的。
单词坐标的话可以直接写个python脚本切分。我之前是用的另一个流程,用chrome自带googlelens做ocr,然后得到位置和其中一个ocr版本,然后用pymupdf解析得到文本和坐标输出csv。