当前位置：首页 > news >正文

网站首页制作流程网站前台乱码

news 2025/11/5 12:07:32

网站首页制作流程,网站前台乱码,wordpress阅读量统计,娄底网站建设方案一、介绍 MinerU作为一款智能数据提取工具#xff0c;其核心功能之一是处理PDF文档和网页内容#xff0c;将其中的文本、图像、表格、公式等信息提取出来#xff0c;并转换为易于阅读和编辑的格式#xff08;如Markdown#xff09;。在这个过程中#xff0c;MinerU需要利…一、介绍 MinerU作为一款智能数据提取工具其核心功能之一是处理PDF文档和网页内容将其中的文本、图像、表格、公式等信息提取出来并转换为易于阅读和编辑的格式如Markdown。在这个过程中MinerU需要利用图像识别、文本识别OCR、布局分析等技术来理解和处理PDF文档和网页中的视觉信息。这些技术正是计算机视觉领域的重要组成部分。二、构建流程系统Ubuntu系统显卡3090 显存24Gcuda11.8 特别提示使用显卡3060也可以没尝试感觉可以 1.查看系统是否有Miniconda3的虚拟环境 conda -V 如果输入命令没有显示Conda版本号则需要安装。 2.更新系统命令输入下列命令将系统更新及系统下载 apt-get update apt-get install ffmpeg libsm6 libxext6 -y3.创建虚拟环境创建名称为MinerU的虚拟环境 conda create -n MinerU python3.8激活“MinerU虚拟环境 conda activate MinerU4.下载模型输入下列命令对MinerU模型进行下载11G左右 git clone https://gitclone.com/github.com/opendatalab/MinerU.git进入模型文件 cd MinerU-master5.下载依赖包输入下列命令 pip install -U magic-pdf[full] --extra-index-url https://wheels.myhloli.com下载时间会很长耐心等待直到出现“Successfully”开头的下载结果 6.下载模型权重文件输入下列命令进行下载 git lfs install git clone https://hf-mirror.com/opendatalab/PDF-Extract-Kit更改权重文件路径(后面运行找不到权重你也可以更改运行代码的获取权重文件路径) cp -r /MinerU-madter/PDF-Extract-Kit/models /tmp/7.项目运行 try.pdf是本上传用于测试的文档你可以根据自己所需上传自己的PDF文档。输入下列命令 magic-pdf –path “try.pdf”解析结束查看结果文件

查看全文

http://www.ho-use.cn/article/10821305.html