当前位置: 首页 > news >正文

中文域名网站标识辽宁自助网站建设公司

中文域名网站标识,辽宁自助网站建设公司,怎么看网站蜘蛛,网站制作公司兴田德润简介最近我在捣鼓一个PDF文件#xff0c;想把它里面的文字和文字颜色给提取出来。后来发现有个叫pymupdf的库能搞定这事儿。操作起来挺简单的#xff0c;pymupdf的示例文档里就有现成的代码可以参考。 how-to-extract-text-with-color 我本地的测试代码如下#xff1a; impor…最近我在捣鼓一个PDF文件想把它里面的文字和文字颜色给提取出来。后来发现有个叫pymupdf的库能搞定这事儿。操作起来挺简单的pymupdf的示例文档里就有现成的代码可以参考。 how-to-extract-text-with-color 我本地的测试代码如下 import pymupdf import sys# sys.argv[1] 为文件名 doc pymupdf.open(sys.argv[1]) page doc[0]for page in doc:text_blocks page.get_text(dict, flagspymupdf.TEXTFLAGS_TEXT)[blocks]for block in text_blocks:for line in block[lines]:for span in line[spans]:text span[text]color pymupdf.sRGB_to_rgb(span[color])print(fText: {text}, Color: {color})运行效果如下 我弄的那个文档里有一块内容是这样的项目里的文字被标成橙色就是那种选中后的样子所以我特别留意了它的颜色提取。 所以我需要抽取出文字的同时还需要文字的颜色 推荐相关的文章 PymuPDF4llmPDF 提取的革命
http://www.ho-use.cn/article/10822710.html

相关文章:

  • 知名营销网站wordpress自定义文章类型输出数量
  • 如何在国外网站做免费推广网站开发新型技术
  • 网站大全下载软件安装佛山制作网站企业
  • 西宁网络公司做网站哪家好福永电子烟网站开发
  • 金融网站建设内容微信小程序制作过程
  • 怎样做交互式网站中国建设教育协会是个什么网站
  • 溧阳做网站的哪家好aso关键词排名优化是什么
  • 微信网站公众平台单位网站建设申请
  • 装修网站怎么建设wordpress积分查看
  • 河南省住房和城乡建设门户网站营销培训师
  • 网站推广的8种方法中达世联网站建设
  • 江苏省和住房城乡建设厅网站wordpress赚钱
  • 如何通过c语言来做网站wordpress 一键分享
  • 汕头网站设计开发建筑人才网 一建港航
  • 百度站长之家工具国外大气网站欣赏
  • 雄安 网站建设小游戏网站怎么做
  • 简单的网站构建的基本流程wordpress 音乐盒
  • 用心做电影的网站关键词都有哪些
  • 玉树wap网站建设公司怎么建设像天猫的网站
  • excel表如何做网站连接深圳网站建设服务商
  • 做家装的设计公司网站cf小号自助购买网站
  • 网页升级紧急通知写作伊宁网站建设优化
  • 网站逻辑结构张家口网站建设价格
  • 做网站被骗了怎么办深圳网络优化
  • 成绩分析智能网站怎么做重庆网站建设changeke
  • 网站建设的整个流程局域网网站怎么做
  • 长春建设网站公司吗项目外包+网站开发
  • django企业网站开发实例四川省建设监理管理协会网站
  • 制作演示网站太仓网站建设网站推广
  • 三 网站建设网站建设要会英语吗