当前位置: 首页 > news >正文

荣县规划和建设局网站官方网站建设成果

荣县规划和建设局网站,官方网站建设成果,wordpress网盘主题,昆网站在哪里小罗碎碎念 最近在整理24年发表在Nature Medicine上的病理AI文章#xff0c;简单列了一个表。 接下来我将按照先后顺序#xff0c;系统的把这13篇文献分析完。其中底色做了填充的#xff0c;代表商业公司在本论文中占据了一作或通讯。 本期推文介绍的模型是CONCH#xff0…小罗碎碎念 最近在整理24年发表在Nature Medicine上的病理AI文章简单列了一个表。 接下来我将按照先后顺序系统的把这13篇文献分析完。其中底色做了填充的代表商业公司在本论文中占据了一作或通讯。 本期推文介绍的模型是CONCHCONtrastive learning from Captions for Histopathology——一个专门为计算病理学开发的视觉语言基础模型。 作者类型作者姓名单位名称中文第一作者Ming Y. Lu哈佛医学院布里格姆和妇女医院病理科第一作者Bowen Chen哈佛医学院布里格姆和妇女医院病理科第一作者Drew F. K. Williamson哈佛医学院布里格姆和妇女医院病理科通讯作者Faisal Mahmood哈佛医学院布里格姆和妇女医院病理科 CONCH在14个不同的基准测试中进行了评估这些测试涉及病理学图像和/或文本的多种下游任务包括组织学图像分类、分割、描述生成以及文本到图像和图像到文本的检索。CONCH在这些任务上都取得了最先进的性能并且可以在无监督微调的情况下直接改善其他模型的性能。 文章强调了数字病理学的快速发展以及深度学习在病理学任务中的应用但也指出了模型训练中存在的标签稀缺问题以及大多数模型仅利用图像数据的限制。CONCH模型通过结合图像和文本数据模拟实际病理学家的工作流程从而克服了这些限制。 研究结果表明CONCH在多种病理学任务上都表现出色包括零样本分类、检索和分割。此外CONCH还展示了在罕见疾病分类和少量样本学习中的潜力。文章还讨论了CONCH在实际应用中的潜在价值包括在病理学实践中的语言使用、教育和研究中的应用以及在临床病理学中的潜在影响。最后文章指出了当前视觉-语言预训练模型的局限性并对未来的研究方向提出了建议。 一、CONCH的数据处理和模型训练流程 1-1数据清洗流程 数据源公开的医学文献和数据库、内部病理图像和报告以及公开数据集 对象检测器Object detector使用YOLOv5模型来识别和提取图像中的对象。这个过程是为了从文献中自动提取病理图像。 标题分割器Caption splitter使用一个经过预训练的生成式变换器GPT模型来将描述多个图像的标题分割成单独的子标题。这个步骤是为了处理包含多个子图像的图像面板。 匹配器Matcher使用一个在清理过的教育数据集上训练的CLIP模型来将分割后的子图像与子标题进行匹配。这个过程通过计算图像嵌入和文本嵌入在对齐潜在空间中的余弦相似性得分来完成。 数据集过滤从原始的179万图像-文本对数据集中首先排除了非人类样本创建了一个117万人类样本的数据集。然后进一步通过训练一个分类器来识别HE苏木精和伊红染色从而过滤出457,373对HE样本以及713,595对IHC 特殊染色样本。 整体上这个流程自动化地处理和过滤了大量病理图像和相关文本数据为训练视觉-语言模型准备了一个清洗过的数据集。 1-2数据集主题分布 这张图展示了数据集的特征描述具体包括不同人体系统的图像数量和标题的字数分布。 人体系统图像数量图中列出了多个人体系统并为每个系统提供了图像数量。例如胃肠道轨迹有最多的图像121,209张而眼睛的图像最少11,569张。 标题字数分布右下角的直方图展示了标题字数的分布。图中有两个数据集的分布PMC-Path紫色和EDU蓝色。可以看到大多数标题的字数集中在较短的范围随着字数增加标题数量迅速下降。 数据集比较从直方图可以观察到PMC-Path数据集的标题通常比EDU数据集的标题要长这可能反映了两个数据源内容的差异。 图标表示每个人体系统前都有一个简单的图标帮助快速识别对应的系统。 整体上这个图表提供了数据集的概览显示了不同人体系统的图像分布和标题的一般特征对理解数据集的组成和特性很有帮助。 1-3视觉-语言预训练设置 这张图展示了一个用于病理图像分析的预训练算法架构。 具体细节如下 图像编码器Image encoder 接收输入为病理图像。图像被分割成多个图像块Image tokens这些块随后被送入Transformer模块进行处理。Transformer模块由多个Transformer块Transformer block组成用于提取图像特征。 注意力池化器Attention pooler 处理完所有图像块后通过注意力池化器Attention pooler聚合信息生成汇总的图像令牌Pooled image tokens。 文本编码器Text encoder 接收与图像相对应的描述性文本Caption。文本被标记化Tokenized生成文本令牌Text tokens。这些文本令牌同样通过Transformer块进行处理以提取文本特征。 对比性对齐Contrastive alignment 目的是在图像和文本的特征空间中对齐它们使得相关的图像和文本在特征空间中彼此靠近。通过最大化图像和文本嵌入的余弦相似性来实现。 融合解码器Fusion decoder 结合图像和文本的特征用于生成描述或执行其他多模态任务。包含交叉注意力Cross-attention机制允许模型在生成过程中同时考虑图像和文本信息。 预训练数据 使用了117万图像-文本对进行预训练这些数据对用于训练模型以理解图像内容和相关文本描述之间的关系。 整体上这个架构通过结合图像和文本信息利用Transformer架构和对比学习来训练一个能够理解病理图像和对应文本描述的模型。这对于后续的细粒度分析、图像检索、自动报告生成等任务至关重要。 1-4性能比较 这张雷达图展示了不同模型在多种下游任务上的性能表现。这些任务包括分类Classification、检索Retrieval和分割Segmentation。 图中比较了四种模型CONCH青色、PLIP黄色、BiomedCLIP蓝色和OpenAICLIP紫色。 任务和数据集 SICAP前列腺癌的Gleason分级。EBRAINS脑肿瘤的细粒度亚型分类。DHMC LUAD肺腺癌的组织学模式分类。TCGA NSCLC非小细胞肺癌的亚型分类。TCGA RCC肾细胞癌的亚型分类。TCGA BRCA乳腺癌的亚型分类。CRC100k结直肠腺癌的组织分类。WSS4LUAD肺腺癌的图像块分类。Source A (t2i) 和 Source B (t2i)两个用于文本到图像和图像到文本检索的数据集。TCGA LUAD (i2t)肺腺癌的图像块用于图像到文本的检索。 性能指标 每个任务的得分范围从0到100反映了模型在该任务上的性能。图中每个轴代表一个任务不同颜色的区域表示不同模型在该任务上的性能。 模型比较 CONCH在大多数任务上都显示出较好的性能特别是在分类任务上。PLIP和BiomedCLIP在某些任务上表现接近但在其他任务上CONCH明显领先。OpenACLIP在某些任务上表现较弱特别是在检索任务上。 二、零样本分类和监督分类的实验设置和结果 2-1零样本分类示意图 这张图展示了一个用于区域感兴趣ROI级别的零样本zero-shot分类的模型架构。为每个类别构建一个提示prompt并根据共享嵌入空间中图像与提示嵌入的接近程度对图像进行分类。 以下是对图中各部分的详细分析 图像/图块Image/tile 左上半部分显示了一个病理图像样本对应roi区域。 类别作为提示Classes as prompts 右上半部分显示了两个文本提示分别描述了两种不同的癌症类型“侵袭性导管癌invasive ductal carcinoma”和“侵袭性小叶癌invasive lobular carcinoma”。这些文本提示用于指导模型识别图像中的特征。 图像编码器Image encoder 图像经过图像编码器处理转换为可以被模型进一步处理的嵌入形式。 文本编码器Text encoder 文本提示也通过文本编码器处理转换为嵌入形式。文本编码器能够理解文本数据并将其转换为模型可以处理的数值型特征。 嵌入空间Embedding space 图像和文本编码器的输出在嵌入空间中相遇。这个空间是一个多维向量空间其中每个维度代表数据的一个特征。在这个空间中相关的图像和文本嵌入应该彼此靠近这是通过对比学习实现的目的是使模型能够理解图像内容和相关文本描述之间的关系。 分类过程 模型通过比较图像嵌入和文本嵌入在嵌入空间中的相似性来进行分类。根据图像嵌入和文本嵌入之间的距离或相似性得分模型可以判断图像最可能属于的类别。 整体上这个架构利用了深度学习中的转移学习和零样本学习的概念允许模型在没有看到特定类别的样本的情况下仅通过文本描述来识别和分类新的图像。这对于病理学图像分析尤其有用因为获取大量标注数据往往是昂贵和耗时的。通过这种方法模型可以更快地适应新的癌症类型或罕见病例只需提供相应的文本描述。 2-2对全玻片图像WSIs进行零样本分类 这张图展示了在全切片图像WSI级别上执行零样本zero-shot分类的流程使用top-K池化技术汇总瓦片的相似度分数形成切片级别的相似度分数其中最高的分数对应于切片级别的预测。 以下是对图中各部分的详细分析 全切片图像WSI 左上角显示了一个全切片图像的缩略图这是病理学分析中常用的高分辨率图像用于诊断和研究。 图块划分Tiled WSI 左下角展示了全切片图像被划分成多个小图块Tiles每个图块可以单独进行分析。 图块分类Tiles 中间部分显示了从全切片图像中提取的几个代表性图块每个图块都用边界框标出。每个图块都通过模型进行分类生成一个分类分数或嵌入向量。 Top-K池化Top-K pooling 为了进行全切片级别的分类模型对所有图块的分类分数执行Top-K池化这意味着从每个类别中选择最高K个分数然后对这些分数进行汇总或平均以生成整个切片的分类预测。 全切片预测Slide prediction 根据Top-K池化的结果模型为整个切片提供一个最终的分类预测结果。 热图Heatmap 右下角展示了一个热图它可视化了全切片图像上各个区域与特定类别关联的强度。热图中的颜色变化例如从蓝色到黄色表示了模型对于不同区域属于某一预测类别的信心程度颜色越暖表示信心越高。 整体上这个流程图说明了如何将全切片图像细分为可管理的图块单独分析每个图块然后汇总信息以进行整个切片的分类。这种方法允许模型在没有针对特定任务进行训练的情况下利用其在大量数据上学到的通用特征提取和匹配能力来预测新图像的类别。 这对于自动化病理图像分析尤其有用因为它可以减少对大量标注数据的依赖同时提供关于整个切片的详细信息。 2-3零样本分类在下游亚型分类和分级任务上的性能 这张图展示了四种不同模型在多个下游任务上的零样本zero-shot性能。 这些模型包括CONCH青色、PLIP黄色、BiomedCLIP蓝色和OpenAICLIP紫色。横轴列出了不同的数据集和任务包括TCGA BRCA、TCGA RCC、TCGA NSCLC、DHMC LUAD、SICAP、CRC100k和WSS4LUAD。 性能指标 Y轴表示零样本性能范围从0到1其中1代表完美性能。每种颜色的柱状图代表一个模型在特定任务上的性能。每个任务上的柱状图都带有一个误差棒表示性能的变动或不确定性。 模型比较 CONCH青色在大多数任务上显示出最高的性能特别是在TCGA BRCA、TCGA RCC和CRC100k数据集上。PLIP黄色在所有任务上表现中等没有在任何特定任务上明显领先。 任务比较 在TCGA NSCLC任务上所有模型的性能都相对较高这表明这些模型能够较好地泛化到这些癌症类型的分类。在DHMC LUAD任务上所有模型的性能都明显下降这可能是由于该数据集的特定挑战或模型对该数据集的泛化能力有限。SICAP任务上CONCH和BiomedCLIP的性能相近而PLIP和OpenAICLIP的性能较低。CRC100k和WSS4LUAD任务上CONCH的性能明显优于其他模型显示了它在这些任务上的优势。 2-4监督评估模型的嵌入 这张图展示了不同模型在多个下游任务上的监督学习性能。这些任务包括TCGA BRCA、TCGA RCC、TCGA NSCLC、SICAP和CRC100k。 图中比较了五种模型CONCH青色、PLIP黄色、BiomedCLIP蓝色、OpenAICLIP紫色以及ResNet50绿色。 性能指标 Y轴表示监督性能范围从0到1其中1代表完美性能。每个任务上的柱状图代表一个模型的性能。每个柱状图都带有一个误差棒表示性能的变动或不确定性。 模型比较 CONCH青色在所有任务上普遍显示出较高的性能尤其是在TCGA RCC和CRC100k上。PLIP黄色在所有任务上表现中等没有在任何特定任务上明显领先。BiomedCLIP蓝色在某些任务上如TCGA NSCLC表现接近或略逊于CONCH。OpenAICLIP紫色在大多数任务上表现较弱尤其是在SICAP上。ResNet50绿色作为基线通常表现低于其他视觉-语言模型这强调了视觉-语言预训练的优势。 任务比较 在TCGA BRCA和TCGA RCC任务上所有模型的性能都相对较高这表明这些模型能够较好地泛化到这些癌症类型的分类。在SICAP任务上CONCH和CTranspath的性能相近而PLIP和OpenACLIP的性能较低。 2-5病理学家标注的IDC、对应的热图和选定的瓦片高倍观察 这张图由三个部分组成展示了病理学图像分析中的热图和示例感兴趣区域ROIs。 由下图可知标注的图像与高相似度区域之间有很好的一致性高相似度区域内的瓦片展示了典型的IDC形态而低相似度区域内则展示了乳腺的基质或其他正常成分。 全切片图像WSI 左图展示了两张手动标注的切片 热图Heatmap 中间图显示了与全切片图像相对应的热图颜色表示了模型对于图像中各个区域的分类信心程度。颜色从蓝色低相似性到红色高相似性变化表示模型对于该区域属于特定类别如癌症的信心程度。可以看到颜色较暖的区域与手动勾画的区域基本一致 示例感兴趣区域Example ROIs 右图显示了从热图中选取的两个示例ROIs的放大图。这些放大的区域提供了更详细的组织结构视图帮助病理学家进一步分析和诊断。标注的尺度如80 μm和96 μm提供了这些区域的实际大小信息。 整体上这种热图方法允许研究者和病理学家快速识别和定位病理学图像中的关键区域从而更有效地进行诊断和分析。通过将全切片图像、热图和示例ROIs结合起来这张图提供了一个全面的视觉工具用于理解和解释病理学图像数据。 三、零样本跨模态检索的性能评估 3-1跨模态检索性能评估 这张图展示了不同模型在跨模态检索任务中的性能具体包括文本到图像Text-to-image和图像到文本Image-to-text的检索。 图中比较了四种模型CONCH青色、PLIP黄色、BiomedCLIP蓝色和OpenAICLIP紫色。 性能指标 Y轴表示检索性能采用召回率recall作为衡量标准范围从0到1其中1代表完美检索性能。图中每个柱状图代表一个模型在一个特定数据集上的性能。每个柱状图都带有一个误差棒表示性能的变动或不确定性。 模型比较 CONCH青色在多数任务上显示出较高的性能尤其是在Source A和Source B的文本到图像检索任务上。PLIP黄色在所有任务上表现中等没有在任何特定任务上明显领先。BiomedCLIP蓝色在某些任务上如TCGA LUAD的图像到文本检索表现接近或略逊于CONCH。OpenAICLIP紫色在大多数任务上表现较弱尤其是在Source A和Source B的文本到图像检索任务上。 任务比较 在Source A和Source B数据集上CONCH在文本到图像检索任务上的性能明显高于其他模型表明它在理解文本描述和检索相关图像方面具有较强的能力。在TCGA LUAD数据集上CONCH在图像到文本检索任务上的性能也优于其他模型显示了它在将图像内容转换为文本描述方面的优势。平均值Average显示了模型在所有任务上的平均性能CONCH再次显示出最高的平均检索性能。 3-2零样本图像到文本检索的示意图 这张图展示了跨模态检索的概念和流程用于在病理学图像分析中根据文本描述检索相应的图像或根据图像检索相应的文本描述。 以下是对图中各部分的详细分析 文本描述Text 右侧列出了与图像相关的文本描述包括 “Crowded gland lined by atypical cells with pale eosinophilic intraluminal secretions”由非典型细胞排列的拥挤腺体内部有淡染的分泌物“Detached tumor cluster floating in the alveolar spaces”在肺泡空间中漂浮的脱离肿瘤团块“Desmoplastic stromal reaction to tumor invasion”对肿瘤侵入的间质性基质反应 这些描述用于训练模型识别图像中的特征。 编码器Encoders 图像编码器Image encoder处理输入的病理图像将其转换为嵌入向量以便模型可以理解和处理。文本编码器Text encoder处理文本描述将其转换为嵌入量模型可以通过这些嵌入量理解文本内容。 嵌入空间Embedding space 图像和文本的嵌入被映射到一个共同的嵌入空间中这个空间允许模型比较图像和文本的相似性。在这个空间中相关的图像和文本嵌入应该彼此靠近模型可以据此进行检索。 检索过程Retrieval 模型在嵌入空间中找到与输入文本描述最匹配的图像或找到与输入图像最匹配的文本描述。图中显示了“Top-1 retrieved”检索到的顶部结果意味着模型为给定的查询找到了最相关的图像。 整体上这个图示意了如何使用深度学习模型进行跨模态检索在病理学图像和文本描述之间建立联系从而实现精确的检索功能。这种技术在自动化病理图像分析和辅助诊断中具有重要应用价值。 3-3TCGA LUAD数据集的检索示例 这张图展示了根据特定文本提示检索到的病理图像示例这些图像与“肺腺癌lung adenocarcinoma”相关联。 每个图像都附有一个分数表示与文本提示的匹配程度以及图像的尺度条显示了图像实际大小。以下是对图中内容的详细分析 Micropapillary微乳头状 分数0.6139尺度400微米μm Acinar腺泡状 分数0.4567尺度150微米μm Papillary乳头状 分数0.6173尺度400微米μm Leipidic类脂质 分数0.5532尺度1000微米μm Solid实性 分数0.4706尺度200微米μm Inflammation炎症 分数0.2038尺度200微米μm Bronchus支气管 分数0.3715尺度300微米μm Vessel血管 分数0.1993尺度700微米μm Necrosis坏死 分数0.3026尺度700微米μm 分析 这些图像是根据与“肺腺癌”相关模式的文本提示进行检索得到的分数反映了图像与文本提示之间的相似度。分数越高表示图像与文本提示的相关性越高。图像的尺度提供了图像在显微镜下的实际大小有助于理解图像中特征的可见度和细节水平。检索结果包括了多种病理学特征如微乳头状、腺泡状、乳头状、类脂质、实性、炎症、支气管、血管和坏死这些都是在肺癌病理诊断中可能会观察到的特征。 四、预训练数据集中不同类别标题内容的定性可视化分析 这张图是一个词云展示了与病理学相关的不同主题和概念。 词云中词语的大小通常表示其在数据集中出现的频率或重要性较大的词语意味着它们在数据集中更为常见或关键。 以下是对图中主要内容的分析 主要主题 图中包含了多个与病理学相关的主题如“肺lung”、“肝liver”、“皮肤skin”、“胃肠道gastrointestinal tract”等。 常见疾病和概念 词云中突出了一些常见的疾病和病理学概念例如“癌症cancer”、“腺泡acinar”、“乳头状papillary”、“类脂质leipidic”、“炎症inflammation”、“坏死necrosis”等。 人体系统和部位 多个人体系统和部位被提及如“皮肤skin”、“胃肠道gastrointestinal tract”、“肝和胆道liver and biliary tract”、“骨、关节和软组织bone, joints, soft tissue”等。 数据集大小 图中还提供了一些数据集的大小如“所有类别1,170,647”、“胃肠道轨迹121,209”、“皮肤90,585”等这指的是与这些主题相关的图像或文本数据对的数量。 颜色和分组 不同颜色用于区分不同的主题或概念群帮助视觉化地组织信息。例如“胃肠道轨迹”、“骨、关节和软组织”、“肺”等每个都有自己独特的颜色。 细节和模式 一些词语描述了病理学图像中可能观察到的特定模式或特征如“微乳头状micropapillary”、“实性solid”、“类脂质leipidic”等。 整体上这张词云图提供了一个视觉化的方式来概览病理学数据集中的关键主题和概念帮助理解数据集的组成和研究的重点领域。通过这种可视化研究者和医生可以快速识别出在病理学图像分析中常见的诊断类型和重要的组织学特征。 五、CONCH模型在肾细胞癌病理图像上的热力图分析 这张图展示了病理图像分析中的一个具体例子包括了整体图像、热图和几个放大的感兴趣区域ROIs。 以下是对图中各部分的详细分析 整体图像Whole Slide Image 左上角显示了一个标记为“Papillary Renal Cell Carcinoma”乳头状肾细胞癌的全切片图像。图像中用蓝色轮廓线标出了肿瘤区域。左上角有一个尺度标记指示图像大小为2毫米。 热图Heatmap 右侧显示了与全切片图像相对应的热图颜色表示了模型对于图像中各个区域的分类信心程度。颜色从蓝色低相似性到红色高相似性变化表示模型对于该区域属于特定类别如癌症的信心程度。热图中有几个用黑色方块标出的区域可能表示模型识别出的关键特征区域。 感兴趣区域ROIs 下方显示了从热图中选取的三个感兴趣区域的放大图像提供了更详细的组织结构视图。这些放大的区域提供了对肿瘤特征的更详细观察如细胞形态、组织结构和可能的病理变化。 整体上这种可视化方法允许研究者和病理学家快速识别和定位病理图像中的关键区域从而更有效地进行诊断和分析。通过结合全切片图像、热图和示例ROIs这张图提供了一个全面的视觉工具用于理解和解释病理图像数据。 六、CONCH模型在图像字幕生成任务上的性能结果 6-1图像字幕生成性能 这张图展示了三个不同模型在图像描述生成任务上的性能比较使用的评估指标是METEOR和ROUGE。 以下是对图中内容的详细分析 模型 CONCH青色GIT-large紫色GIT-base红色 评估指标 METEOR一种评估机器翻译质量的自动度量考虑了同义词和词形变化值越高表示生成的描述与真实描述越接近。ROUGE基于n-gram的评估方法计算生成描述和真实描述之间的重叠程度值越高表示两者越相似。 误差棒 每个柱状图上的误差棒表示性能评估的置信区间较长的误差棒意味着模型性能的变动较大。 性能比较 CONCH模型在图像描述生成任务上的性能优于GIT的两个版本特别是在METEOR评估标准下。GIT-large和GIT-base的性能相对接近但都不如CONCH。 这张图表明CONCH模型在图像描述任务上具有更好的泛化能力和描述精度能够生成与真实情况更为接近的文本描述。这对于需要精确描述生成病理图像内容的应用场景如自动报告生成特别有用。 6-2高质量字幕示例 这张图展示了模型在病理图像分析中的几个正确预测的例子每个例子都包括了图像和对应的文本描述。 Glioblastoma星形细胞瘤 图像显示了高细胞密度的星形细胞瘤细胞具有丝状活性血管明显出血区域周围有少量纤维组织。文本描述强调了星形细胞瘤的细胞学特征包括高度细胞性、丝状活跃的细胞、明显的血管和出血区域。 Oncocarcytoma癌泡状瘤 图像展示了癌泡状瘤的特征细胞形成离散的巢状结构位于肾实质内由类似多边形细胞和类似肝细胞的细胞组成具有癌泡状外观。文本描述指出了癌泡状瘤的组织学特征包括在肾实质内形成的离散巢状结构和细胞的多边形性及肝样细胞特征。 Renal oncocytoma肾癌 图像显示了肾癌的特征多边形细胞形成离散的巢状结构类似肝细胞具有癌泡状外观。文本描述了肾癌的组织学特征包括多边形细胞形成的离散巢状结构和癌泡状外观。 6-3部分正确字幕示例 这张图展示了模型在病理图像分析中的几个部分正确预测的例子每个例子都包括了图像和对应的文本描述。 以下是对图中内容的详细分析 癌泡状瘤oncocytoma 图像显示了大小一致的肿瘤细胞具有明显的粉红色细胞质。文本描述指出了明显的透明细胞存在但未观察到丝状分裂像。 染色体性肾细胞癌Chromophobe renal cell carcinoma 图像展示了大小一致的肿瘤细胞具有明显的粉红色细胞质。文本描述强调了明显的细胞边界但同样未观察到丝状分裂像。 星形细胞瘤glioblastoma 图像显示了高度细胞性的肿瘤具有明显的超染色体和多形性。文本描述了明显的血管和中心的淡染坏死区域肿瘤细胞集中于此。 星形细胞瘤glioblastoma 图像显示了高度细胞性的肿瘤具有明显的超染色体和多形性。文本描述了明显的血管和左侧的坏死区域存在多个丝状分裂像包括非典型的丝状分裂像。 此外一些生成的文本几乎是训练数据集中的原文复述这可能是由于微调数据集规模有限训练集n558。 由于当前的预训练规模相对于通用视觉-语言领域的工作来说仍然较小预计随着更多高质量训练数据的增加微调后的字幕生成性能有可能会显著提高。
http://www.ho-use.cn/article/10822366.html

相关文章:

  • 沧州市做网站如何免费自学网站建设
  • 包小盒设计网站申请免费网站
  • 网站开发 犯法网站开发费用清单
  • 桂林相关网站扬中论坛最新
  • 网页设计国外设计欣赏网站最赚钱的小型加工厂
  • 深圳做网站公司地点山东省建设工程信息网官网
  • 网站域名缴费高端网站建设 企业网站建站
  • 大连网站开发乛薇阿里企业邮箱怎么样
  • 珠海做网站公司搭建 wordpress 简书
  • 做一个小程序需要多少钱?seo发包软件
  • 企业网站建设中期报告模板wordpress在哪
  • 如何建立一个私人网站做电子商务网站价格
  • 西安企业网站制作试描述一下网站建设的基本流程图
  • 视频网站建设成本海阳玖网站建设
  • 有没有做吉祥物的网站无锡电子商务网站建设公司
  • 造纸公司网站建设做网站常德
  • 免费网站建设合同范本网站建设技术要求
  • 中太建设集团股份有限公司网站网站类网站开发犯罪吗
  • 长春电商网站建设哪家专业免费算生辰八字算命
  • 好网站你知道的wordpress 郁思注意
  • 微网站开发案例建设网站不用模板可以吗
  • 大连公司网站开发wordpress恢复
  • 做网站后期费用去长沙旅游攻略及费用
  • 印花图案设计网站免备案虚拟主机哪家强
  • 珠海市网站建设怎么样淘宝店招图片大全免费
  • 网站建设与网页设计实训报告水滴信用企业查询官网
  • 建设银行报考网站品牌加盟最好的网站建设
  • 小白网站搭建教程河北建设人才网官网
  • 深圳外贸网站制作公司石景山 网站建设
  • 内江规划建设教育网站网站微信支付申请流程