当前位置: 首页 > news >正文

做图片网站 侵权山西省建设工程信息网

做图片网站 侵权,山西省建设工程信息网,虚拟主机管理系统源码,帝国软件怎么做网站诊断通常使用组织病理学切片#xff0c;可以确定组织是否处于导管原位癌(DCIS)阶段#xff0c;其中癌细胞尚未扩散到周围乳腺组织#xff0c;或浸润性导管癌(IDC)阶段#xff0c;其中细胞已渗透到邻近组织。对于医生来说#xff0c;检测IDC非常耗时且具有挑战性。因此可以确定组织是否处于导管原位癌(DCIS)阶段其中癌细胞尚未扩散到周围乳腺组织或浸润性导管癌(IDC)阶段其中细胞已渗透到邻近组织。对于医生来说检测IDC非常耗时且具有挑战性。因此这可以建模为图像分类任务其中模式识别和机器学习可用于帮助医生和医疗从业者做出此类关键决策。 在本文中使用包含277,524张图像的IDC乳腺癌数据集(其中78,786张IDC阳性图像和198,738张IDC阴性图像)将图像分为IDC()和IDC(-)。为此使用了特征提取器包括SIFT、SURF和ORB等纹理特征以及Haralick纹理特征等统计特征。然后将这些特征组合起来生成一个包含782个特征的数据集。通过使用各种机器学习分类器(如Random Forest, Extra Trees, XGBoost, AdaBoost, CatBoost和多层感知器)堆叠这些特征然后使用Pearson相关系数进行特征选择产生具有四个特征的数据集然后用于分类。从实验结果中发现CatBoost产生了最高的准确率(92.55%)这与其他最先进的结果相当其中大多数使用深度学习架构。 1. 引言 由于治疗取决于癌症的分期任何病理学家的初步任务之一包括对苏木精和伊红(HE)染色的组织病理学切片进行视觉分析。通过切片可以判断组织是导管原位癌(DCIS)期还是浸润性导管癌(IDC)期。乳腺导管原位癌是一种非侵袭性癌症在乳腺导管内壁发现癌细胞但尚未扩散到周围乳腺组织。然而在IDC中在乳管中开始形成的异常癌细胞扩散到乳管以外的乳腺组织的其他部分。IDC是最常见的乳腺癌类型约占所有乳腺癌诊断的70-80%。IDC检测作为治疗过程的重要组成部分是一项极其耗时和困难的工作。 鉴于上述情况使用图像处理技术将组织病理切片分类为IDC()和IDC(-)的问题委托给ML。机器学习依赖于从图像中提取特征描述符然后进行分类。这些描述符包括颜色描述符如RGB直方图;统计描述符比如哈拉里克特征;和纹理描述符如加速鲁棒特征(SURF)等。 ML的替代方案是在DL中使用神经网络这省去了手工制作特征的需要。然而这是以更大的复杂性和更高的计算能力为代价的。此外为了正确地训练DL模型需要大量的输入样本而这些样本有时可能无法用于现实问题。 本文中尝试使用纹理和统计特征的集合将组织病理学图像分为IDC()和IDC(-)。 使用随机森林(Random Forest)、CatBoost (CB)和AdaBoost (AB)等各种标准ML算法计算了尺度不变特征变换(SIFT)、SURF、定向FAST和旋转BRIEF (ORB)和灰度共生矩阵(GLCM)等纹理特征和统计特征(Haralick特征)的精度。然后将这些分数与这些特征的各种组合的准确性指标进行比较。用叠加的方法将所有的特征集合在一起得到了最好的结果。 1.1 工作贡献 提出了一种纹理和统计描述符的集成方法然后使用ML分类器(如RF和CB)进行分类。用于组合的方法是堆叠。 利用基于Pearson’s Correlation Coefficient的特征选择对传统的叠加方法进行了修改以剔除潜在的冗余特征。 对SURF、SIFT、ORB、GLCM和Haralick及其各种组合的相对性能进行了全面的比较。 创建了一个轻量级的ML模型它在计算上便宜在算法上易于设计。与其他现有的方法相比它即使不是更准确也是同样准确的。 (a)在训练集上训练分类器。然后使用训练好的分类器来预测验证集和测试集的结果。  (b)第二阶段堆叠不同分类器的验证预测以生成新的训练特征同时堆叠不同分类器的测试预测以生成新的测试特征。利用这些新的训练和测试特征对分类器进行评估。 (c)提出的模型其中第二阶段被修改在模型训练和测试之前对新的训练和测试特征进行特征选择。  2. 文献调查 Narayanan等提出了一种新颖的深度CNN架构。图像从50 × 50缩小到48 × 48。在预处理阶段采用了颜色恒常性技术和直方图均衡化技术。然后将预处理后的图像输入CNN。所提出的架构由五个卷积层组成然后是一个完全连接(FC)层和一个softmax层。与使用直方图均衡化预处理的图像相比使用颜色恒定技术预处理的图像产生了更好的性能指标。  Debelee等使用CNN提取特征并采用主成分分析进行降维。使用k-近邻(k-NN)对乳房x线照片进行正常或异常分类。Debelee等使用预训练的Inception-V3及其提出的改进的自适应K-means (MAKM)方法从图像中提取特征。从ROI和基于cnn提取的特征中融合GLCM和Gabor(纹理特征)并将其输入5个分类器(SVM、k-NN、NB、MLP和RF)中以量化特征的描述能力。  Rahman等提出了多层CNN。IDC数据集存在明显的类不平衡。从IDC()和IDC(-)两个类别中选取相同数量的图像以消除类别不平衡问题。图像的选择是随机进行的以避免偏差。通过应用各种数据增强来减轻过拟合即随机10度旋转移动缩放和水平和垂直翻转。实现的体系结构达到89%的准确率。 Romano和Hernandez也纠正了IDC()数据集中存在的阶级不平衡。对图像进行归一化处理并对数据进行增强防止过拟合。使用随机转换数组增强图像以便分类器永远不会两次查看完全相同的图像。 Cruz-Roa等提出了一种三层CNN架构用于自动检测全幻灯片图像(WSI)中的IDC组织区域。CNN在第一层、第二层卷积池化层和FC层分别有16、32和128个神经元。Wang等人将Cruz-Roa等人的架构的工作扩展到四种不同的架构。得出结论数据增强在使用IDC()数据集自动检测乳腺癌方面无效。删除了分割不规则性。有太多的图像不是50 × 50的必须删除。所有的冗余图像90%的黑色空间或90%的白色空间被删除。 3. 提出的方法 通过提取IDC()和IDC(-)图像的SIFT、SURF和ORB等纹理特征和Haralick特征等统计特征对其进行分类。提取后对这些特征进行组合再通过叠加进行集合。然后使用叠加的特征来获得最终的预测。 从组织病理学图像开始从中提取256个SIFT, 256个SURF, 256个ORB和14个Haralicks特征。然后将782( 256 256 256 14)个特征组合起来。然后通过堆叠将这些特征组合起来。为了剔除冗余特征使用Pearson相关系数。然后进行模型训练和测试最终将图像分类为IDC(-)和IDC()。  3.1 数据集描述 IDC乳腺组织病理学图像数据集。原始数据集由162张40倍扫描的乳腺癌标本WSI组成。从WSI中提取277,524个分辨率为50 × 50的斑块。其中IDC(-)为198738张IDC()为78786张。  IDC数据集https://www.kaggle.com/datasets/paultimothymooney/breast-histopathology-images 3.2 特征提取 3.2.1 尺度不变特征变换SIFT SIFT是一种特征提取方法用于在图像中检测和描述局部特征。这些特征或关键点在图像尺度变化和旋转时都是不变的。这意味着即使图像被放大、缩小或旋转这些关键点仍然可以被识别出来。 SIFT的工作流程 首先从一组参考图像中提取SIFT关键点并将这些关键点存储在数据库中。当有新图像需要识别时算法会模拟新图像中的每个属性与数据库中的属性。基于欧几里得距离一种衡量两点间“直线”距离的方法算法会查找与新图像中特征向量相近的候选对象。具体来说新图像中的每个特征都会与数据库中的特征进行比较并基于特征向量之间的欧几里得距离来找到候选匹配对象。为了有效地确定一致的特征群集即指向同一对象的多个关键点算法使用了一个基于广义霍夫变换的哈希表实现。这有助于快速找到在多个位置都出现的特征从而指示可能存在的对象。一旦找到指向同一对象的三个或更多特征算法会进行额外的模型验证来确保这些特征确实属于同一对象。在验证过程中不符合模型的特征即异常值会被剔除。最后根据匹配的准确性和可能的错误匹配数量算法会计算某个特征集指示对象存在的可能性。只有通过了所有测试的对象匹配才会被认为是正确的。 SIFT算法通过提取和比较图像中的关键点来识别对象这些关键点在图像尺度变化和旋转时都是不变的。它使用广义霍夫变换和哈希表来有效地找到一致的特征群集并通过模型验证来剔除异常值。最终算法根据匹配的准确性和可能性来确定哪些对象匹配是正确的。 3.2.2  加速的健壮特性SURF SURF是一种用于对象识别、图像配准、分类等任务的局部特征检测器和描述符。尽管它受到SIFT描述符的启发但SURF的执行速度比SIFT快得多。SURF特征检测器通过在不同尺度上应用近似的高斯二阶导数掩模到图像上来工作。与Harris角点检测方法相比SURF对旋转的鲁棒性更强。SURF之所以非常快是因为它使用了积分图像。在积分图像中像素(x, y)的值是由原点和(x, y)定义的矩形内所有值的和。源图像中任何大小的矩形内的像素和都可以通过四个操作找到。这允许以非常少的计算时间应用任何大小的矩形掩模。 3.2.3 ORB (Oriented FAST and Rotated BRIEF) ORB是一个旨在为SIFT提供一个高效且快速的替代品的特征检测器和描述符。由Rublee等人提出是FAST关键点检测器和视觉描述符BRIEFBinary Robust Independent Elementary Features的修改版本的结合。ORB在特征检测任务上的性能与SIFT相当但速度要快得多。ORB的基础检测器即FAST关键点检测器和BRIEF描述符都以低成本提供了良好的性能。ORB的主要贡献包括 为FAST添加了方向组件。有效地计算了定向BRIEF特征。一种在旋转不变性下使BRIEF特征去相关的方法从而在最近邻应用中获得更好的性能。对定向BRIEF特征的方差和相关性进行分析。 3.2.4 Haralick Features Haralick纹理特征是基于灰度共生矩阵GLC计算的。灰度共生矩阵是一种用于描述图像中灰度级空间分布和关系的矩阵。通过计算GLC的不同统计量如对比度、相关性、能量等可以获得一组能够描述图像纹理的特征。这些特征在医学图像分析、机器视觉、无损检测等领域有广泛应用。 3.3 堆叠集成 集成学习是一种机器学习范式其中多个模型通常被称为“弱学习器”被训练来解决相同的问题并通过某种方式组合起来以获得更好的结果。集成学习的主要思想是当弱学习器被正确组合时我们可以获得更准确和更鲁棒的模型。         堆叠是集成学习的一种方法其中多个弱学习器被训练并通过训练一个元模型meta-model来组合它们。这个元模型基于这些弱学习器返回的多个预测结果来产生最终的预测。堆叠与其他集成算法如boosting和bagging的不同之处在于它考虑了不同类型的算法作为弱学习器即异质弱学习器。         对于我们的分类任务选择了以下算法作为弱学习器XGBoostXGB、AdaBoostAB、CatBoostCB、随机森林RF、Extra TreesET和多层感知器MLP。这些弱学习器将基于包含SURF、SIFT、ORB和Haralick特征的数据集进行训练。 堆叠的过程包括以下几个步骤 分割训练数据将训练数据分为两部分两折。训练弱学习器使用第一折训练数据来拟合训练选择的弱学习器即XGB、AB、CB、RF、ET和MLP。进行预测对于每个弱学习器使用它们在验证数据和测试数据上进行预测。训练元模型将弱学习器在验证集上的预测结果作为新的训练特征在测试集上的预测结果作为新的测试特征。然后使用这些新的特征来训练和测试元模型如逻辑回归、支持向量机等。元模型的输出将是最终的预测结果。 因此堆叠本质上是两个模型的结合一个是拟合训练数据并编译其预测的基本模型另一个是学习如何最好地组合基本模型生成的预测的元模型。在实践中在步骤3之后检查新创建的特征之间的Pearson相关系数以剔除潜在的冗余特征然后进行最终预测。  在机器学习的堆叠集成Stacking中元模型扮演着将多个基本模型的输出作为新的特征输入并进行最终预测的角色。具体来说堆叠集成首先将原始训练数据划分为训练集和验证集然后使用训练集训练多个基本模型每个模型在验证集上生成预测结果。这些预测结果作为新的特征与原始特征一起输入到元模型中训练元模型以获得最终的预测。
http://www.ho-use.cn/article/10813646.html

相关文章:

  • 电子商务网站html模板金昌市建设工程质量监督站网站
  • 网站详情页怎么做的网站广告位有哪些
  • 广东省网站建设公司排名汕头专业的免费建站
  • 做互联网网站赚钱吗五金塑胶 技术支持 东莞网站建设
  • 手机咋做网站国外跨境电商平台有哪些
  • 杭州网企业网站建设wordpress 侧栏加flash
  • 免费建网站平台教考试网站模版
  • 四川营销网站建设网站建设前景怎么样
  • 中企动力做网站怎么样广西互联网营销公司
  • 个体工商户可以申请网站建设吗wordpress如何生成rss
  • wap站是什么意思啊公司网站运营维护单位
  • 建站国外百元服务器wordpress标题字体修改
  • 三门峡住房城乡建设局网站物联网专业就业方向
  • 连云港网站关键词建站之星至尊版
  • 制作网页的网站有哪些网站如何被搜索到
  • 厦门网站设计公司推荐诚信通旺铺网站建设
  • 实验室网站制作西昌规划和建设局网站
  • 深圳做网站的大公司艾融软件是外包公司么
  • 开个网站需要什么品牌推广方案设计
  • 成都优创智汇网站建设网站设计的原则
  • 沈阳网站app制作中国域名是
  • 电脑怎样做幻灯片的网站网页图片怎么保存为pdf文件
  • wordpress响应式网站模板网站 被攻击_主业篡改 被黑了 织梦做的站
  • 广州商旅网站制作自己搭建域名服务器
  • 屏蔽收索引擎抓取网站wordpress主题熊掌号
  • 泉州模板做网站网址大全2345电脑版
  • 免费建音乐网站网络营销哪家正规公司
  • 学科网站建设方案o2o的代表平台有哪些
  • 商务网站策划书长春做网站新格公司
  • 银行网站建设公司软件开发工程师的前景