当前位置: 首页 > news >正文

如何做聚合类网站wordpress支持python吗

如何做聚合类网站,wordpress支持python吗,网页作品展示,网站推广计划书模板1.数据清洗定义 数据清洗是对一些没有用的数据进行处理的过程。很多数据集存在数据缺失、数据格式错误、错误数据或重复数据的情况#xff0c;如果要使数据分析更加准确#xff0c;就需要对这些没有用的数据进行处理。 2.清洗空值 DataFrame.dropna(axis0, howany, threshN…1.数据清洗定义 数据清洗是对一些没有用的数据进行处理的过程。很多数据集存在数据缺失、数据格式错误、错误数据或重复数据的情况如果要使数据分析更加准确就需要对这些没有用的数据进行处理。 2.清洗空值 DataFrame.dropna(axis0, howany, threshNone, subsetNone, inplaceFalse) 删除包含空字段的行可以使用 dropna() 方法。可以通过 isnull() 判断各个单元格是否为空。 1axis默认为 0表示逢空值剔除整行如果设置参数 axis1 表示逢空值去掉整列。 2how默认为 any 如果一行或一列里任何一个数据有出现 NA 就去掉整行如果设置 howall 一行或列都是 NA 才去掉这整行。 3thresh设置需要多少非空值的数据才可以保留下来的。 subset设置想要检查的列。如果是多个列可以使用列名的 list 作为参数。 4inplace如果设置 True将计算得到的值直接覆盖之前的值并返回 None修改源数据。 import pandas as pddf pd.read_csv(property-data.csv)print (df[NUM_BEDROOMS]) print (df[NUM_BEDROOMS].isnull()) 3.指定空数据类型 import pandas as pdmissing_values [n/a, na, --] df pd.read_csv(property-data.csv, na_values missing_values)print (df[NUM_BEDROOMS]) print (df[NUM_BEDROOMS].isnull()) 4.删除包含空数据的行 import pandas as pddf pd.read_csv(property-data.csv)new_df df.dropna()print(new_df.to_string()) 5.使用 inplace True 参数修改源数据 DataFrame import pandas as pddf pd.read_csv(property-data.csv)df.dropna(inplace True)print(df.to_string()) 6.移除 ST_NUM 列中字段值为空的行 import pandas as pddf pd.read_csv(property-data.csv)df.dropna(subset[ST_NUM], inplace True)print(df.to_string()) 7.用fillna() 方法替换空字段 import pandas as pddf pd.read_csv(property-data.csv)df.fillna(12345, inplace True)print(df.to_string()) 8.指定列来替换数据 import pandas as pddf pd.read_csv(property-data.csv)df[PID].fillna(12345, inplace True)print(df.to_string()) 9.使用 mean() 方法计算列的均值并替换空单元格 替换空单元格的方法是计算列的均值、中位数值或众数。Pandas使用 mean()、median() 和 mode() 方法计算列的均值所有值加起来的平均值、中位数值排序后排在中间的数和众数出现频率最高的数。 import pandas as pddf pd.read_csv(property-data.csv)x df[ST_NUM].mean()df[ST_NUM].fillna(x, inplace True)print(df.to_string()) 10.使用 median() 方法计算列的中位数并替换空单元格 import pandas as pddf pd.read_csv(property-data.csv)x df[ST_NUM].median()df[ST_NUM].fillna(x, inplace True)print(df.to_string()) 11.使用 mode() 方法计算列的众数并替换空单元格 import pandas as pddf pd.read_csv(property-data.csv)x df[ST_NUM].mode()df[ST_NUM].fillna(x, inplace True)print(df.to_string()) 12.清洗格式错误数据 数据格式错误的单元格会使数据分析变得困难甚至不可能。可通过包含空单元格的行或将列中所有单元格转换为相同格式数据。 import pandas as pd# 第三个日期格式错误 data {Date: [2020/12/01, 2020/12/02 , 20201226],duration: [50, 40, 45] }df pd.DataFrame(data, index [day1, day2, day3])df[Date] pd.to_datetime(df[Date], formatmixed)print(df.to_string()) 13.清洗错误数据 数据错误是常见情况可以对错误的数据进行替换或移除。 import pandas as pdperson {name: [Google, Kalika , Taobao],age: [50, 40, 12345]    # 12345 年龄数据是错误的 }df pd.DataFrame(person)df.loc[2, age] 30 # 修改数据print(df.to_string()) 14.设置条件语句 import pandas as pdperson {name: [Google, Kalika , Taobao],age: [50, 200, 12345]    }df pd.DataFrame(person)for x in df.index:if df.loc[x, age] 120:df.loc[x, age] 120print(df.to_string()) 15.将错误数据的行删除 import pandas as pdperson {name: [Google, Kalika , Taobao],age: [50, 40, 12345]    # 12345 年龄数据是错误的 }df pd.DataFrame(person)for x in df.index:if df.loc[x, age] 120:df.drop(x, inplace True)print(df.to_string()) 16.清洗重复数据 清洗重复数据可以使用 duplicated() 和 drop_duplicates() 方法。如果对应数据重复duplicated() 会返回 True否则返回 False。 import pandas as pdperson {name: [Google, Kalika, Kalika, Taobao],age: [50, 40, 40, 23]  }df pd.DataFrame(person)print(df.duplicated()) 17.使用drop_duplicates() 方法删除重复数据 import pandas as pdpersons {name: [Google, Kalika, Kalika, Taobao],age: [50, 40, 40, 23]  }df pd.DataFrame(persons)df.drop_duplicates(inplace True)print(df)
http://www.ho-use.cn/article/10823966.html

相关文章:

  • 网站改了模板被百度降权最便宜做个网站多少钱
  • 给钱做任务的网站重庆seo推广外包
  • 设计主题网站怎样看一个网站的信息吗
  • 织梦网站管理系统小说推广合作平台入口
  • 网站设计步骤大全萧山区建设工程质量监督站网站
  • 中国建设教育协会培训中心网站站优化
  • 做网站生意多吗短网址助手
  • 什么网站收录快关键词优化seo费用
  • 平台网站怎么优化中搜seo
  • 商城网站功能介绍建设网站要求有哪些
  • 门户网站制作平台视觉做的比较好的国外网站
  • 学校建设网站费用申请报告关键词排名优化系统
  • 网站维护一次一般要多久seo的目的是什么
  • 网站开发中 html网站自己优化
  • 链接提交百度站长平台wordpress重新配置ftp
  • 免费的网站域名查询方法有哪些加拿大28平台微信
  • 只有后端可以做网站吗wordpress标签3d
  • 企业制作网站一般多少钱网站首页制作代码
  • 网站开发包含哪些搜狗关键词排名查询
  • wordpress网站例qq引流推广平台
  • 海淀网站建设多少钱沈阳建设电商网站
  • 淘宝客网站怎么批量采集淘宝商品方维采集淘宝数据思路如何线上注册公司
  • app调用网站农村电商平台发展现状
  • isite企业建站系统免版权费自建网站
  • 物流门户网站源码军事新闻头条最新军情
  • 做网站的论文摘要开发商延期交房怎么办
  • 河北省电力建设第一工程公司网站wordpress免费主题 开源
  • 网站质量北京开发公司
  • 织梦怎么做企业网站网站制作公司前十排名
  • 珠海网站搜索引擎优化宁波优化网站哪家好