当前位置: 首页 > news >正文

如何进行网站建设分析石家庄城乡建设厅网站

如何进行网站建设分析,石家庄城乡建设厅网站,小程序开发平台官网入口,什么推广方法是有效果的一、PDF文件介绍 PDF是英文Portable Document Format缩写#xff0c;就是可移植的意思#xff0c;它是以PostScript语言图象模型为基础#xff0c;无论在哪种打印机上都可保证精确的颜色和准确的打印效果#xff0c;PostScript咱也不懂#xff0c;估计和SVG的原理差不多吧…一、PDF文件介绍 PDF是英文Portable Document Format缩写就是可移植的意思它是以PostScript语言图象模型为基础无论在哪种打印机上都可保证精确的颜色和准确的打印效果PostScript咱也不懂估计和SVG的原理差不多吧。 二、PDF文件格式 PDF文件是二进制数据可以用Sublime的HexViewer打开。 1、首部 指明文件PDF版本号%PDF-1.4 其中最后一位 4就是文件格式的版本号。 2、文件体 PDF文件主要部分由一系列obj对象组成类似如下格式 3 0 obj ........endobj# 3 对象编号 0 修改次数 3、交叉引用表 用于索引各个obj 对象在文档中的位置以实现随机访问 xref.0 180000000000 65535 f0000010112 00000 n.....# 0000000000 第一对象起始地址修改次数 65535#最大修改次数表示不可再改 f 表示free # 这里可以看成文件头# 0000010112 第二对象超始地址n表示对象正在使用 4、尾部 指明文件体根对象和交叉引用表地址 trailer./Info 17 0 R/ID [df2c5533d0ab7c62ee7732a5e375592ab07f35295e287c0a5febcad25060ccbf]/Root 16 0 R/Size 18.startxref.83511.%%EOF.# trailer 说明文件尾 trailer对象的开始# Size 18 该PDF文件的对象数目# Root 16 根对象的对象号为16# startxref.83511 交叉引用表地f址 三、解析PDF文件 Java PdfBox、Python的Pdfminer都可以解析出PDF中的文本但无论哪个工具都只能把PDF文本一行行打印出来具体的字段解析还是要自己用正则去匹配。 下面介绍一下Python3的pdfminer3k 1、安装 pip install pdfminer3k 2、pdfminer3k几个主要类介绍 PDFParser从PDF文件中提取数据PDFDocumentPDF文档对象PDFPageInterpreter处理页面内容 下面是解析简历PDF数据需要把关键信息提取出来刚从网上找了些代码简单实现了一下代码还没有做任何异常处理先能跑通再说。 注这代码对扫描版本的PDF是没有办法解析出来的。
http://www.ho-use.cn/article/10822222.html

相关文章:

  • 那里有制作网站公司百度教育小程序入口
  • 在意派建设好网站后室内设计网站免费素材
  • 做网站后的总结品牌建设经费投入占比
  • 网上学习做网站广州市住房与城乡建设部网站
  • 广东省建设信息网站爱站seo排名可以做哪些网站
  • 网站设计 中国风百度会收录双域名的网站么
  • 建设网站的建议西安产品设计公司
  • 网站建设公司哪些主要哪些wordpress xmlseo
  • 小学网站aspseo站点
  • 贵州省中海工程建设有限公司网站济源网络推广
  • 作一个网站要多少钱网站建设陕西
  • 网站专题页面怎么做网络平台建设授权书实名认证
  • 电子商务网站营销的方法纯文字网站设计
  • 恶意点击软件安阳网站优化
  • 如何宣传自己的网站传媒公司简介范文
  • 莆田网站建设莆田设计案例网站
  • 公家网站模板如何运营垂直网站
  • 实战营销型网站建设wordpress 强制ssl
  • 洛阳网站制作公司关于政务网站建设工作情况的总结
  • 网站开发开发需求文档模板竞价托管外包公司
  • 网站搭建的策略与方法榆林市网站建设
  • 大连市城市建设管理局网站织梦做的网站怎么加弹窗
  • 上传网站需要什么软件网站网页设计费用
  • 公司网站域名主机wordpress文章内容乱码
  • 江西建设职业技术学院官方网站网站推广代理
  • 深圳网站建设 设计创公司做网站需要具备什么
  • 开通企业网站公司的网站续费
  • 设计网站建wp做网站
  • 网站建设评判标准学校网站的作用和意义
  • 网站拥有权审计局网站建设管理