当前位置: 首页 > news >正文

高水平高职院校 建设网站/青岛seo博客

高水平高职院校 建设网站,青岛seo博客,上海法资企业名录,网络规划设计师论文方向目录 一、事件复盘: 二、解决方案: 三、讨论 一、事件复盘: hdfs无法创建新的文件,xceivercount超过最大设置,平时每个datanode只有100个左右的连接,突然达到8000以上。 事故原因,跨多天的…

目录

一、事件复盘:

二、解决方案:

三、讨论


一、事件复盘:

hdfs无法创建新的文件,xceivercount超过最大设置,平时每个datanode只有100个左右的连接,突然达到8000以上。

事故原因,跨多天的动态分区导致: sql如下

set hive.exec.reducers.max=1000;
INSERT INTO TABLE table1 PARTITION (dt)  
selectuid,times,memo,idfa,dtfrom table2 where dt>=20230101 and dt<=20231231 distribute by rand()

使用动态分区虽然非常方便,但会带来很多小文件,像上面这个sql,动态分区是365天,reduce是1000个,如果计算比较复杂,资源充足,就会同时创建365*1000个文件。 因为是动态分区,每个reduce都要写365个文件到各自的分区中,因为数据by rand()把数据打散了。

二、解决方案:

1、降低同时正在运行的reduce数

配置如下:

mapreduce.job.running.reduce.limit=200;

这样同时运行的reduce只能到200,就是有一年的分区,也最多创建 365*200个文件。

2、如果想限制动态分区的跨天范围,也可以做如下限制

hive.exec.max.dynamic.partitions=100;

也就是动态分区只能一次创建100个,超过会报错。

3、其实动态分区不适合跨天的情况,跨天数据重跑完全可以按天一天一天的补,通过提高重跑天的次数来完成并发。

三、讨论

有人会觉得我可以增大xceivercount的数目,来避免这个问题,但是这个首先要重启datanode,另外,这个方案始终(目前已经达到了8000个连接一台机器)还是会导致大量的连接数存在,对整个集群不是很友好,还是尽量减少小文件的生成为最佳

http://www.ho-use.cn/article/294.html

相关文章:

  • 做网站搜索如何显示官网/海口seo快速排名优化
  • 泉州网站建设选择讯呢/网站查询ip地址
  • wordpress手册 chm/宁波网站关键词优化公司
  • 做网站有哪些行业/关键词难易度分析
  • 计算机应用网站开发毕业论文/百度网址大全旧版安装
  • 黄页网址免费网站吃奶/微信营销方法
  • 手机网站头部图片怎么做/搜索率最高的关键词
  • iis 网站关闭/品牌推广网络公司
  • 成都有实力的网站建设/seo引擎优化方案
  • 二百块做网站/seo服务商
  • 哪些公司做外贸网站好/中国国际新闻
  • 公司宣传片拍摄脚本/深圳博惠seo
  • 网站系统管理/win7优化工具
  • 网站设计实例/百度商家入驻
  • 想做水果外卖怎么做网站/服装市场调研报告范文
  • 行业资讯平台网站建设/百度小说官网
  • 南通江苏网站建设/凡科建站怎么用
  • 上海武汉阳网站建设/关键词优化推广排名多少钱
  • 专业商城网站制作公司/在线种子资源网
  • 旅游网站国际业务怎样做/美食软文300字
  • 网站建设维护公司/饥饿营销的十大案例
  • 网站建设邮箱/市场营销最有效的手段
  • 深圳seo整站优化承接/自媒体平台注册官网下载
  • 盈利型网站/aso安卓优化
  • 可以做哪些有趣的网站/互联广告精准营销
  • 房山做网站公司/网络营销的四种方式
  • iOS开发 隐私政策网站怎么做/不受国内限制的搜索引擎
  • 网站建设期间工作/抖音seo优化怎么做
  • 一流网站建设公司/宁波seo教程app推广
  • 建站行业突破/网站seo推广公司靠谱吗