当前位置: 首页 > news >正文

怎么在自己做网站网站安全建设架构

怎么在自己做网站,网站安全建设架构,app网站开发定制,两颗米网站建设将excel文件转成txt文件#xff0c;再将txt文件上传hdfs#xff0c;最后传入hive中 注意的点 #xff08;1#xff09;先判断写入的txt文件是否存在#xff0c;如果不存在就需要创建路径 #xff08;2#xff09;如果txt文件已经存在#xff0c;那么先将对应的文件进行…将excel文件转成txt文件再将txt文件上传hdfs最后传入hive中 注意的点 1先判断写入的txt文件是否存在如果不存在就需要创建路径 2如果txt文件已经存在那么先将对应的文件进行删除后再写入txt数据 3excel文件中有可能第一行是字段名需要跳过 版本1 本地版本 1.利用python将excel转成txt文件 from datetime import datetime, timedelta import os import pytz import pandas as pddef excel_to_txt(name, date):# Read Excel file into a DataFramedf pd.read_excel(fdata/excel/{name}.xlsx, headerNone, skiprows1)# Define output directory and pathoutput_directory os.path.join(data, txt, date)os.makedirs(output_directory, exist_okTrue) # Create directory if it doesnt existoutput_path os.path.join(output_directory, f{name}.txt)# Check if the file already exists, if so, remove itif os.path.exists(output_path):os.remove(output_path)print(fExisting file {output_path} removed.)# Write DataFrame to a new text fileprint(开始写入txt文件)df.to_csv(output_path, headerNone, sep\t, indexFalse)print(文件写入成功!)return output_pathif __name__ __main__:current_time datetime.now(pytz.timezone(Asia/Shanghai))one_day_ago (current_time - timedelta(days1)).strftime(%Y-%m-%d)local_file_path excel_to_txt(IS_GS_Recruitment_Data_20231211, one_day_ago)print(local_file_path) 2.上传到hdfs 3.在hive中创建表 drop table if exists ticket.test_text; create external table IF NOT EXISTS ticket.test_text (name string,age int ) comment row format delimited fields terminated by \tlines terminated by \nNULL DEFINED AS stored as textfileLOCATION /warehouse/ticket/ods/test_text;4.将hdfs数据写入hive load data inpath /origin_data/test.txt overwrite into table ticket.test_text;2服务器版本 先把excel_to_txt脚本上传到服务器 excel_to_txt.py from datetime import datetime, timedelta import os import pytz import pandas as pddef excel_to_txt(name, date):# Read Excel file into a DataFramedf pd.read_excel(f/opt/module/data/excel/{name}.xlsx, headerNone,skiprows1)# df pd.read_excel(fhdfs://mycluster:8020/origin_data/hr_cn/db/is_gs_recruitment_data_full/excel/{name}.xlsx, headerNone,skiprows1)# df pd.read_excel(fdata/excel/{name}.xlsx, headerNone,skiprows1)# Define output directory and pathoutput_directory os.path.join(/opt/module/data, txt, date)os.makedirs(output_directory, exist_okTrue) # Create directory if it doesnt existoutput_path os.path.join(output_directory, f{name}.txt)# Check if the file already exists, if so, remove itif os.path.exists(output_path):os.remove(output_path)print(fExisting file {output_path} removed.)# Write DataFrame to a new text fileprint(开始写入txt文件)df.to_csv(output_path, headerNone, sep\t, indexFalse)print(文件写入成功!)return output_pathif __name__ __main__:current_time datetime.now(pytz.timezone(Asia/Shanghai))one_day_ago (current_time - timedelta(days1)).strftime(%Y-%m-%d)local_file_path excel_to_txt(IS_GS_Recruitment_Data_20231211, one_day_ago)print(local_file_path)2.安装python3环境安装链接 https://editor.csdn.net/md/?articleId129627849 3.执行python脚本 recruitment_excel_to_txt.sh #!/bin/bash /opt/module/miniconda3/bin/python /opt/module/data/excel/excel_to_txt.py4.上传到hdfs并将数据导入hive recruitment_hdfs_to_ods.sh #!/bin/bash DATAX_HOME/opt/module/datax# 如果传入日期则do_date等于传入的日期否则等于前一天日期 if [ -n $2 ] ;thendatestr$2 elsedatestr$(date -d -1 day %F) fi# 处理目标路径检查目标路径是否存在且不为空如果不为空则清空目录内容 handle_target() {content_size$(hadoop fs -count $1 | awk {print $3})if [[ $content_size -ne 0 ]]; thenecho 路径$1不为空正在清空......hadoop fs -rm -r -f $1/*fi }# 整合处理目标路径和上传文件的逻辑 handle_target_and_put() {handle_target $2echo 上傳文件hadoop fs -put $1 $2 }function import_data(){ # $*: 获取所有参数,如果使用包裹之后,$*当做整体 # $#: 获取参数个数 # $: 获取所有参数,如果使用包裹之后,把每个参数当做单独的个体 # $?: 获取上一个指令的结果tableNames$*sqluse hr_cn;#遍历所有表,拼接每个表的数据加载sql语句for table in $tableNamesdosql${sql}load data inpath /origin_data/hr_cn/db/${table:4}/${datestr}/* overwrite into table ${table} partition (dt$datestr);done#执行sql/opt/module/hive/bin/hive -e $sql }case $1 in all)handle_target_and_put /opt/module/data/txt/${datestr}/ /origin_data/hr_cn/db/recruitment_info_full/import_data ods_recruitment_info_full;; recruitment_info)handle_target_and_put /opt/module/data/txt/${datestr}/ /origin_data/hr_cn/db/recruitment_info_full/import_data ods_recruitment_info_full;; esac
http://www.ho-use.cn/article/10813842.html

相关文章:

  • 商品网站建设实验报告子域名查询工具
  • 成都网站优化常识总部在上海的世界500强企业
  • 创建网站快捷方式到桌面oa办公管理系统哪个好
  • 怎么做相册的网站网站建设价格套餐
  • 阿里云个人网站制作湛江网站建设方案报价
  • 新乡高端网站建设北京seo教师
  • 天津建站模板网站模板展示
  • 网站开发维护求职信淘宝电子网站建设论文
  • 合适的网站建设明细报价表wordpress官方空间
  • 内蒙古网站建设熊掌号wordpress 伪静态500
  • 濮阳免费网站制作中国建筑工程网施工资料
  • 部门网站建设管理报告提供商城网站
  • 浅谈学校网站建设一个可以做行程的网站
  • 搜房网网站跳出率临沧网站建设公司招聘
  • 鹿泉城乡建设局网站网站单子
  • 中小学建设网站同一人可以做几个网站的负责人
  • 军博网站建设怎么用小程序做微网站
  • 龙城网站建设网站建设的现状分析
  • 十万pv的网站建设北京托管网站
  • 建设网站和推广知名网站开发公司
  • 包头市建设厅官方网站吉林市网站建设招标
  • 完成一份网站建设前期规划方案网站和微信公众号建设方案
  • 网站使用手册楚雄做网站
  • 网站报名怎么做热点链接到另一个网站怎么做
  • 网站开发基本过程前端网页模板下载
  • 百度做的网站后台怎么进广告联盟网站建设
  • 胶州做网站珠海专业做网站的公司
  • 大兴安岭地网站seo什么网站有加工外发做的
  • 浦江做网站怎么做虚拟币网站
  • 天河营销型网站建设有哪些做品牌特卖的网站