当前位置: 首页 > news >正文

手机怎么做销售网站淘宝网站是谁做的

手机怎么做销售网站,淘宝网站是谁做的,电子商务网站建设的步骤一般为,货运代理网站模板偏最小二乘法回归算法简介 算法概述 偏最小二乘法模型可分为偏最小二乘回归模型和偏最小二乘路径模型。其中偏最小二乘回归模型是一种新型的多元统计方法#xff0c;它集中了主成分分析、典型相关分析和线性回归的特点#xff0c;特别在解决回归中的共线性问题具有无可比拟…偏最小二乘法回归算法简介 算法概述 偏最小二乘法模型可分为偏最小二乘回归模型和偏最小二乘路径模型。其中偏最小二乘回归模型是一种新型的多元统计方法它集中了主成分分析、典型相关分析和线性回归的特点特别在解决回归中的共线性问题具有无可比拟的优势。偏最小二乘回归模型虽然与主成分分析有关系但它不是寻找响应和独立变量之间最小方差的超平面而是通过投影预测变量和观测变量到一个新空间来寻找一个线性回归模型。特别当两组变量的个数很多且存在多重相关性而观测数据的数量较少时用偏最小二乘回归建立的模型具有传统的经典回归分析等方法所没有的优点。 偏最小二乘路径模型是偏最小二乘法的应用可以应用于一些难以直接观测的现象进行分析也可以考察分析现象之间的关联关系等。偏最小二乘路径模型降低了结构方程需要大量的样本数据且观测变量服从多元正态分布的要求。模型的工作目标与结构方程模型基本一致但与结构方程基本协方差矩阵建模的思路不同偏最小二乘路径模型采用的是一系列一元或多元线性回归的迭代求解。在实际应用中无需对观测变量做特定的概率分布假设也不存在模型不可识别问题并且由于采用偏最小二乘法对样本容量的要求也非常宽松。由此可见偏最小二乘路径模型是一种更加实用和有效的线性建模方法。 算法发展历史 1975年在求解实际应用中发现很多的问题不能用结构方程求解所以伍德等人提出更为简单的分析技术即偏最小二乘路径模型。与结构方程相比该方法使用条件更为广泛效果更好。 1983年瑞典统计学家Herman Wold和阿巴诺最先提出了最小二乘法并将其应用于社会科学中然后由赫曼的儿子Svante Wold发展这个理论。 特别是近十年来偏最小二乘在理论、方法和应用方面都得到了迅速的发展。密西根大学的佛奈尔教授称偏最小二乘回归为第二代回归方法。 偏最小二乘法回归算法原理 现实问题中的自变量之间往往会存在大量的自相关情况所以对这类问题使用普通的最小二乘法不能够求解这是因为变量多重相关性会严重危害参数估计扩大模型误差并且破坏模型的稳定性。偏最小二乘法开辟了一种有效的技术途径它利用对系统中的数据信息进行分解和筛选的方式提取对因变量的解释性最强的综合变量辨识系统中的信息与噪声从而更好地克服变量多重相关性在系统建模中的不良作用。 第一步对原始数据X和Y进行标准化得到X0和Y0其中X为m维的数据Y是p维的数据从Y0中选择方差最大的一列作为u1方便后面计算因为选取方差最大就表示该列是最能反映原始数据信息的一列即根据主成分分析的思想我们称这列向量为第一主成分并使X与Y之间的相关性达最大。 标准化后的矩阵 第二步迭代求解X与Y的变换权重w1,c1和综合因子t1,u1直到收敛 假设X与Y提取的主成分为t1和u1t1是自变量集的线性组合u1是因变量集的线性组合为了回归分析的需求需要满足两个要求t1和u1各自尽可能多的提取所在变量组的变异信息t1和u1的相关性达到最大。 计算公式 利用第一步选择的Y中的列求解X的变换权重因子 利用X的信息t1求解Y的变换权重c1并且更新因子u1的值 判断是否已找到合理的解否则继续寻找。 其中t1和u1的估计方程为 第三步求X与Y的残差矩阵 计算公式 1求X的载荷P1载荷是反映X0和因子T1的直接关系 2求X0的残差X1残差表示了u1不能反映X0信息的部分 3求Y的载荷Q1: 4建立X因子t1与Y因子u1之间的回归模型并用t1预测u1的信息 5求Y0的残差Y1这个值表达了X与因子t1所不能预测的Y0中的信息 第四步利用X1与Y1重复上述步骤求解下一个主成分的偏最小二乘的参数。 最后得到偏最小二乘回归模型的回归方程还应该对回归系数进行检验一般情况下可以通过交叉有效性检验来确定。交叉有效性检验通过求解预测误差平方和与误差平方和的比值这个比值越小越好一般设置的限定值为0.05所以当该比值越小增加新的主成分有利于提高模型的精度反之认为增加新的成分对减少方程的预测误差无明显的改善作用。 定义交叉有效性 这样在建模时每一步计算结束前均进行交叉有效性检验如果在第h步有 时模型已达到精度要求可停止提取成分若 表示第h步提取的 成分的边际贡献显著应继续第h1步计算。 偏最小二乘法回归算法代码实现 import numpy as npdef pls_regression(X, Y, L):偏最小二乘回归算法。参数:X : numpy.ndarray特征矩阵每一行是一个样本每一列是一个特征。Y : numpy.ndarray目标矩阵每一行是一个样本每一列是一个目标变量。L : int要提取的潜在变量数量。返回:T : numpy.ndarrayX的得分矩阵。U : numpy.ndarrayY的得分矩阵。P : numpy.ndarrayX的权重矩阵。Q : numpy.ndarrayY的权重矩阵。n, p X.shapem, _ Y.shapeW np.zeros((p, L))Q np.zeros((p, L))P np.zeros((m, L))U np.zeros((m, L))T np.zeros((n, L))for i in range(L):# 计算权重向量Xtx X.T XXty X.T YW[:, i] Xty / np.sqrt(Xtx W[:, i])# 计算得分向量T[:, i] X W[:, i]# 计算Y的权重和得分Yty Y.T YU[:, i] Yty W[:, i] / np.linalg.norm(W[:, i])Q[:, i] Y.T U[:, i]# 计算X和Y的权重P[:, i] Xty U[:, i].T / np.linalg.norm(U[:, i])# 去相关X X - T W[:, i].TY Y - U[:, i] Q[:, i].Treturn T, U, P, Q# 示例数据 X np.random.rand(100, 10) # 100个样本10个特征 Y np.random.rand(100, 1) # 100个样本1个目标变量# 调用PLS回归函数 L 3 # 假设我们想要3个潜在变量 T, U, P, Q pls_regression(X, Y, L)# 使用得到的权重和得分进行预测 Y_pred T P.T 偏最小二乘法回归算法优缺点 算法优点 处理多重共线性PLS能够在自变量存在严重多重相关性的条件下进行回归建模 。样本量少于变量数允许在样本点个数少于变量个数的条件下进行回归建模 。包含所有自变量在最终模型中将包含原有的所有自变量 。辨识系统信息与噪声模型更易于辨识系统信息与噪声包括一些非随机性的噪声 。易于解释的系数每一个自变量的回归系数将更容易解释 。预测性能在提取主成分的过程中考虑了自变量与因变量之间的关联使得提取的主成分能同时优化因变量预测性能因此通常在预测任务上能取得更好的结果 。适用于高通量数据适用于诸如基因组学、转录组学等高通量数据分析在这些领域中自变量数目可能大于样本数 。 算法缺点 线性假设限制PLS回归本身是线性模型尽管可以处理一定程度的非线性关系但在非线性关系强烈的场景下可能不如非线性模型有效 。模型选择问题在PLS中需要选择合适的潜在变量数量这可能需要依赖经验和交叉验证来确定 。计算复杂性相比于简单的线性回归PLS的计算过程更为复杂可能需要更多的计算资源。过度依赖主成分如果主成分不能很好地代表数据的变异性PLS模型可能无法提供准确的预测 。对异常值敏感PLS方法可能对数据中的异常值比较敏感这可能影响模型的稳定性和预测能力 。 偏最小二乘法回归算法应用 偏最小二乘法回归算法PLS在多个领域有着广泛的应用以下是一些常见的应用场景 化学计量学PLS回归特别适用于处理化学光谱数据分析例如近红外光谱NIR、紫外可见光谱UV-Vis、拉曼光谱等。这些光谱数据通常包含大量的变量如不同波长处的吸光度并且各变量间可能存在高度相关性。通过PLS回归研究者可以从复杂的光谱数据中构建预测模型将光谱信息与样品的化学成分、物理性质或工艺参数等联系起来实现无损、快速的定量或定性分析 。金融行业在风险管理中PLS回归能够处理多种可能具有共线性的财务指标帮助金融机构预测公司的信用风险、违约概率或其他金融表现指标。通过结合众多的财务报表数据如资产负债率、流动比率、盈利能力指标等PLS回归模型可以发现这些变量与潜在违约行为间的非线性关系从而优化风险评估体系 。生物医学研究在基因表达数据分析中PLS回归被用来探索基因表达谱如RNA测序或微阵列数据与临床表型如疾病状态、药物反应、生存率等之间的关联。由于基因数据通常是高维度且具有噪声而样本数量相对较少因此PLS回归能够减少数据维度并在小样本情况下找到基因表达模式与疾病发展或治疗响应的重要关联 。环境科学PLS回归在环境科学中被用于分析环境污染物的监测数据预测环境质量变化趋势。通过处理高维且可能存在多重共线性的环境监测数据PLS回归可以帮助科学家更准确地预测和评估环境变化 。社会科学在社会科学研究中PLS回归常用于分析复杂的社会经济数据如消费者行为、社会态度等。由于这些数据通常包含多个相关变量PLS回归能够提取关键因素建立预测模型 。市场营销和战略管理PLS回归在市场营销和战略管理中被用来分析消费者满意度、品牌忠诚度等多维数据帮助企业更好地理解市场动态和消费者需求 。小样本数据分析PLS回归特别适用于小样本数据的情况。在样本数量较少但变量较多的情况下PLS回归能够通过提取主成分进行有效的回归分析避免了传统回归方法在这种情况下可能出现的问题 。高维数据处理在自变量和因变量维数都很高的情况下PLS回归通过降维技术能够提炼出最重要的信息并构建预测模型提高了模型的解释性和预测性能 。处理多重共线性PLS回归能够有效克服因变量和自变量之间存在的多重共线性问题即使自变量之间高度相关也能通过提取主成分进行有效的回归分析
http://www.ho-use.cn/article/10817211.html

相关文章:

  • 360浏览器打不开90设计网站手机网站制作软件下载
  • 浙江建设局网站首页新闻排版设计用什么软件
  • 东莞网站开发推荐电子商务网站建设与电子支付
  • 西安网站建设培训wordpress难
  • 为什么做网站费用贵订阅号自定义可以做链接网站不
  • 前端和做网站手机网站安装
  • 网站诊断内容公司域名注册查询
  • 西安哪家公司做网站好什么是网站的域名
  • 如何调整网站板块位置wordpress用什么发post
  • 静态网站结构如何更新临沂网站建设有哪些
  • 全国网站备案拍照展示型网站建设方案书
  • 职业技能培训网站佛山网站建设工作
  • 中石化第五建设有限公司官方网站房地产销售基础知识大全
  • 网站建设如何选择域名ui培训班哪里比较好
  • 网站建设改版升级校园环境设计规划及实施方案
  • 我要建立一个网站辽宁省住建厅建设网站
  • 北京搬家公司口碑排行电话邢台网站建设优化
  • 行业网站设计师招聘东莞市住建局官网查询
  • 济南网站排名优化报价遵义建设厅官方网站
  • 深圳企业网站建设多少钱沙漠风网站建设
  • 湘潭网站定制酒店网站制作公司
  • 做跟单员的话应该关注哪些网站硬件开发专业
  • 做分析图很好用的网站wordpress 文章 接口
  • 国内校园网站建设wordpress黄页
  • windows部署网站php建筑公司企业发展建议
  • 吉林省建设部网站网站如何设置长尾词
  • 东莞网站建设设计公司哪家好discuz是什么
  • 建一个商城网站需要多少钱百度一下百度搜索网站
  • 网网站设计河南省建设厅网站考试成绩查询
  • 海珠营销型网站建设录像网站怎么做