工具介绍
MinerU是一款由上海人工智能实验室OpenDataLab团队开发的开源高质量数据提取工具,专注于从复杂PDF文档、网页和电子书中高效提取内容。它能够将包含图片、公式和表格的多模态PDF转化为Markdown格式(如markdown、json),且具备高精度解析工具链,支持多种输入模型,支持自动识别乱码、转换公式为LaTex、保留文档结构,支持176种语言的准确识别,适用于学术、财务、法律等领域,兼容Windows/Linux/Mac平台。
工具地址
网站:https://opendatalab.com/OpenSourceTools/Extractor/PDF
GitHub:https://github.com/opendatalab/MinerU
【Applnn】温馨提醒:
1.本站发布的文章及附件仅限用于学习和研究,不得用于商业或非法用途,否则后果请用户自负!
2.本站信息来自网络收集整理,版权争议与本站无关,仅供学习研究,如有侵权请联系客服删除!
3.如果您喜欢该程序和内容,请支持正版,购买注册,得到更好的正版服务。
4.如果您喜欢我们,多多分享给你们朋友吧!