当前位置: 首页 > news >正文

烟台市做网站找哪家好外贸seo博客

烟台市做网站找哪家好,外贸seo博客,红色礼品网站模板,模板网站建设源码1.本地爬虫 Pattern:表示正则表达式 Matcher:文本匹配器#xff0c;作用按照正则表达式的规则去读取字符串#xff0c;从头开始读取。在大串中去找符合匹配规则的子串。 1.2.获取Pattern对象 通过Pattern p Pattern.compile(正则表达式);获得 1.3.获取Matc…1.本地爬虫 Pattern:表示正则表达式 Matcher:文本匹配器作用按照正则表达式的规则去读取字符串从头开始读取。在大串中去找符合匹配规则的子串。 1.2.获取Pattern对象 通过Pattern p Pattern.compile(正则表达式);获得 1.3.获取Matcher对象 通过Matcher m p.matcher(str);获得  (m要在str中找符合p规则的小串) 其中, m为Matcher对象, p为正则表达式规则, str为要验证的字符串. 1.4.匹配文本中的对象 boolean b m.find(); 表示拿着文本匹配器从头开始读取寻找是否有满足规则的子串如果没有方法返回false. 如果有返回true。在底层记录子串的起始索引和结束索引1. 1.5.截取文本匹配器的索引 String s m.group(); 这时文本匹配器会停留在第一个匹配文本的结束索引1处, 返回一个文本中索引为(0,4)不包含4索引的字符串(符合规则的).  1.6.继续匹配和获取索引 重复第4步和第五步, 从上一次停留的地方开始向后查找. 第4步和第5步一般通过while(m.find()){}循环实现. String s 电话12345678901, 邮箱123qq.com;// 写正则表达式String regex ([1]\\d{10}|\\w{1,}[\\w[^-]]{2,}([.][c][omn]{1,3}));// 生成正则对象Pattern pattern Pattern.compile(regex);// 生成匹配器对象Matcher matcher pattern.matcher(s);// 用循环去读取匹配的内容while (matcher.find()) {// 获取匹配的字符串String group matcher.group();System.out.println(group);} 2.网络爬虫 // 创建一个URL对象URL url new URL(https://blog.csdn.net/Orange_sparkle?typelately);// 连接网址URLConnection conn url.openConnection(); // conn.setRequestProperty(User-Agent, Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt));// 创建对象读取数据BufferedReader bufferedReader new BufferedReader(new InputStreamReader(conn.getInputStream())); // conn.setRequestProperty(User-Agent, Mozilla/4.76);String information;// 获取正则表达式对象pattern // String regex ; // Pattern pattern Pattern.compile(regex);// 在读取的时候每次读一行while ((information bufferedReader.readLine()) ! null) {System.out.println(information); // Matcher matcher pattern.matcher(information); // while (matcher.find()){ // System.out.println(matcher.group()); // }}bufferedReader.close(); 3.有条件的爬取数据 ? 代表的是前面的数据, 后面的一个符号加正则表达式的意思是后面需要跟随的数据. 如果不看符号表示的就是需要匹配Java(8|11|17)这个字符串. 而其中的符号表示如下 :  表示只获取等号之前的数据, 忽略之后的. : 表示冒号前后都获取 ! 表示获取除了感叹号之后的数据 除了设置正则表达式不同, 之后的步骤都和之前一样 4.贪婪爬取和非贪婪爬取 贪婪爬取 : 在爬取数据的时候尽可能的多获取数据 (如:abbbbbbbbbbbb) 非贪婪爬取 : 在爬取数据的时候尽可能的少获取数据 (如:ab) Java当中默认的就是贪婪爬取 如果我们在数量词*的后面加上问号那么此时就是非贪婪爬取 5.正则表达式在字符串中的使用 先创建一个正则表达式规则, 然后传入字符串方法中, 返回的就是新的替换后的字符串或切割后的字符串数组了. 6.分组 红色为第一组, 蓝色为第二组, 绿色为第三组 6.1.捕获分组 \\组号表示的就是把该组匹配的内容在匹配一遍, 两部分的内容相同. 在外部使用本组数据需要用到$组号. 6.2非捕获分组 特点:不占用组号 7.总结
http://www.ho-use.cn/article/10815651.html

相关文章:

  • 建设信息网的网站或平台登陆建设网站的费用调研
  • 购物网站开发报告池州有哪些做网站的
  • 哪些网站做高尔夫旅游网站专题制作软件
  • 外贸平台哪个网站最好知乎一个网站完整的html代码
  • 制作app软件平台网络推广公司优化客
  • 北京网站设计确保代码符合w3c邯郸做移动网站哪儿好
  • 建设银行网站用户登录北京百度公司地址在哪里
  • 绵阳网站建设网站建设宁波建站方案
  • 如何建立一个网站请简述流程wordpress下载的主题如何安装
  • dw网页制作教程 div视频教程网站404页面优化
  • 网站建设服务都包含中怎么做网站上下载图片的功能
  • 做网站需要购买网站空间吗房地产论坛网站建设
  • 销售网站的技巧深圳专业营销网站设计
  • 门户网站建设运营百度云 wordpress
  • 只做一页的网站多少钱代理网络手游
  • 杭州网站建设 网络服务如何下载wordpress
  • 商业网站设计惠州中小企业网站制作
  • 网站内链怎么删除wordpress标题带竖
  • 网站自然排名成都百度快照优化排名
  • 网站建设 国外wordpress 微信发布文章
  • 上海文明城市建设网站北京工程建设公共资源交易平台
  • 如何查看网站服务器网络公司加盟代理
  • 多就能自己做网站巴中汽车网站建设
  • 张家港外贸网站建设建设电商网站报价
  • 注册微商店铺如何注册青岛百度排名优化
  • discuz做电影网站软件开发项目预算
  • 南昌建设企业网站网站asp文件只读
  • 东莞正规网站建设如何编写一份网站开发需求文档
  • 西工网站建设设计东莞房价2023年最新房价走势
  • 国有企业投资建设项目厦门seo收费