Donut:无需 OCR 理解文档内容

Donut:无需 OCR 理解文档内容

Donut是一种新的文档理解方法,使用无OCR端到端Transformer模型,在各种视觉文档理解任务上显示出最先进的性能。此外,SynthDoG是一种合成文档生成器,帮助模型预训练在各种语言和领域上具有灵活性。预训练模型和Web演示可用于文档解析、文档分类、文档VQA和(伪)文本阅读任务。代码和数据集在MIT许可下在GitHub上可用。

cc49cf7efa36433a850aa3b08c99f787_2076989541495611392

原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun235088.html

(0)
打赏 微信扫一扫不于多少! 微信扫一扫不于多少! 支付宝扫一扫礼轻情意重 支付宝扫一扫礼轻情意重
上一篇 2023年6月12日
下一篇 2023年6月12日

相关推荐