当前位置: 首页 > news >正文

wordpress 知名网站产品推广公司

wordpress 知名网站,产品推广公司,优化设计六年级上册语文答案,福州外包加工网#x1f49d;#x1f49d;#x1f49d;欢迎来到我的博客#xff0c;很高兴能够在这里和您见面#xff01;希望您在这里可以感受到一份轻松愉快的氛围#xff0c;不仅可以获得有趣的内容和知识#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学… 欢迎来到我的博客很高兴能够在这里和您见面希望您在这里可以感受到一份轻松愉快的氛围不仅可以获得有趣的内容和知识也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学习,不断总结,共同进步,活到老学到老导航 檀越剑指大厂系列:全面总结 java 核心技术,jvm,并发编程 redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,typora 等数据库系列:详细总结了常用数据库 mysql 技术点,以及工作中遇到的 mysql 问题等新空间代码工作室:提供各种软件服务,承接各种毕业设计,毕业论文等懒人运维系列:总结好用的命令,解放双手不香吗?能用一个命令完成绝不用两个操作数据结构与算法系列:总结数据结构和算法,不同类型针对性训练,提升编程思维,剑指大厂 非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。 ✨✨ 欢迎订阅本专栏 ✨✨ 博客目录 1.评分机制 TF\IDF2.score 是如何被计算出来的3.分析如何被匹配上4.Doc value5.query phase6.replica shard 提升吞吐量7.fetch phbase 工作流程8.搜索参数小总结9.bucket 和 metric 1.评分机制 TF\IDF TF-IDFTerm Frequency-Inverse Document Frequency是一种用于信息检索和文本挖掘的统计方法用以评估一个词在一个文档集中一个特定文档的重要程度。这个评分机制考虑了一个词语在特定文档中的出现频率Term FrequencyTF和在整个文档集中的逆文档频率Inverse Document FrequencyIDF。 TFTerm Frequency词频Term FrequencyTF表示一个词在一个特定文档中出现的频率。这通常是该词在文档中出现次数与文档的总词数之比。 IDFInverse Document Frequency逆文档频率Inverse Document FrequencyIDF是一个词在文档集中的重要性的度量。如果一个词很常见出现在很多文档中例如“和”“是”等那么它可能不会携带有用的信息。IDF 度量就是为了降低这些常见词在文档相似性度量中的权重。 2.score 是如何被计算出来的 GET /book/_search?explaintrue {query: {match: {description: java程序员}} }返回 {took: 5,timed_out: false,_shards: {total: 1,successful: 1,skipped: 0,failed: 0},hits: {total: {value: 2,relation: eq},max_score: 2.137549,hits: [{_shard: [book][0],_node: MDA45-r6SUGJ0ZyqyhTINA,_index: book,_type: _doc,_id: 3,_score: 2.137549,_source: {name: spring开发基础,description: spring 在java领域非常流行java程序员都在用。,studymodel: 201001,price: 88.6,timestamp: 2019-08-24 19:11:35,pic: group1/M00/00/00/wKhlQFs6RCeAY0pHAAJx5ZjNDEM428.jpg,tags: [spring, java]},_explanation: {value: 2.137549,description: sum of:,details: [{value: 0.7936629,description: weight(description:java in 0) [PerFieldSimilarity], result of:,details: [{value: 0.7936629,description: score(freq2.0), product of:,details: [{value: 2.2,description: boost,details: []},{value: 0.47000363,description: idf, computed as log(1 (N - n 0.5) / (n 0.5)) from:,details: [{value: 2,description: n, number of documents containing term,details: []},{value: 3,description: N, total number of documents with field,details: []}]},{value: 0.7675597,description: tf, computed as freq / (freq k1 * (1 - b b * dl / avgdl)) from:,details: [{value: 2.0,description: freq, occurrences of term within document,details: []},{value: 1.2,description: k1, term saturation parameter,details: []},{value: 0.75,description: b, length normalization parameter,details: []},{value: 12.0,description: dl, length of field,details: []},{value: 35.333332,description: avgdl, average length of field,details: []}]}]}]},{value: 1.3438859,description: weight(description:程序员 in 0) [PerFieldSimilarity], result of:,details: [{value: 1.3438859,description: score(freq1.0), product of:,details: [{value: 2.2,description: boost,details: []},{value: 0.98082924,description: idf, computed as log(1 (N - n 0.5) / (n 0.5)) from:,details: [{value: 1,description: n, number of documents containing term,details: []},{value: 3,description: N, total number of documents with field,details: []}]},{value: 0.6227967,description: tf, computed as freq / (freq k1 * (1 - b b * dl / avgdl)) from:,details: [{value: 1.0,description: freq, occurrences of term within document,details: []},{value: 1.2,description: k1, term saturation parameter,details: []},{value: 0.75,description: b, length normalization parameter,details: []},{value: 12.0,description: dl, length of field,details: []},{value: 35.333332,description: avgdl, average length of field,details: []}]}]}]}]}},{_shard: [book][0],_node: MDA45-r6SUGJ0ZyqyhTINA,_index: book,_type: _doc,_id: 2,_score: 0.57961315,_source: {name: java编程思想,description: java语言是世界第一编程语言在软件开发领域使用人数最多。,studymodel: 201001,price: 68.6,timestamp: 2019-08-25 19:11:35,pic: group1/M00/00/00/wKhlQFs6RCeAY0pHAAJx5ZjNDEM428.jpg,tags: [java, dev]},_explanation: {value: 0.57961315,description: sum of:,details: [{value: 0.57961315,description: weight(description:java in 0) [PerFieldSimilarity], result of:,details: [{value: 0.57961315,description: score(freq1.0), product of:,details: [{value: 2.2,description: boost,details: []},{value: 0.47000363,description: idf, computed as log(1 (N - n 0.5) / (n 0.5)) from:,details: [{value: 2,description: n, number of documents containing term,details: []},{value: 3,description: N, total number of documents with field,details: []}]},{value: 0.56055,description: tf, computed as freq / (freq k1 * (1 - b b * dl / avgdl)) from:,details: [{value: 1.0,description: freq, occurrences of term within document,details: []},{value: 1.2,description: k1, term saturation parameter,details: []},{value: 0.75,description: b, length normalization parameter,details: []},{value: 19.0,description: dl, length of field,details: []},{value: 35.333332,description: avgdl, average length of field,details: []}]}]}]}]}}]} }3.分析如何被匹配上 分析一个 document 是如何被匹配上的 最终得分IDF 得分 GET /book/_explain/3 {query: {match: {description: java程序员}} }4.Doc value 搜索的时候要依靠倒排索引排序的时候需要依靠正排索引看到每个 document 的每个 field然后进行排序所谓的正排索引其实就是 doc values 在建立索引的时候一方面会建立倒排索引以供搜索用一方面会建立正排索引也就是 doc values以供排序聚合过滤等操作使用 doc values 是被保存在磁盘上的此时如果内存足够os 会自动将其缓存在内存中性能还是会很高如果内存不足够os 会将其写入磁盘上 倒排索引 doc1: hello world you and me doc2: hi, world, how are you termdoc1doc2hello*world**you**and*me*hi*how*are* 搜索时 hello you -- hello, you hello -- doc1 you -- doc1,doc2 doc1: hello world you and me doc2: hi, world, how are you sort by 出现问题 正排索引 doc1: { “name”: “jack”, “age”: 27 } doc2: { “name”: “tom”, “age”: 30 } documentnameagedoc1jack27doc2tom30 5.query phase 搜索请求发送到某一个 coordinate node构构建一个 priority queue长度以 paging 操作 from 和 size 为准默认为 10 coordinate node 将请求转发到所有 shard每个 shard 本地搜索并构建一个本地的 priority queue 各个 shard 将自己的 priority queue 返回给 coordinate node并构建一个全局的 priority queue 6.replica shard 提升吞吐量 replica shard 如何提升搜索吞吐量 一次请求要打到所有 shard 的一个 replica/primary 上去如果每个 shard 都有多个 replica那么同时并发过来的搜索请求可以同时打到其他的 replica 上去 7.fetch phbase 工作流程 coordinate node 构建完 priority queue 之后就发送 mget 请求去所有 shard 上获取对应的 document 各个 shard 将 document 返回给 coordinate node coordinate node 将合并后的 document 结果返回给 client 客户端 一般搜索如果不加 from 和 size就默认搜索前 10 条按照_score 排序 8.搜索参数小总结 preference: 决定了哪些 shard 会被用来执行搜索操作 _primary, _primary_first, _local, _only_node:xyz, _prefer_node:xyz, _shards:2,3 bouncing results 问题两个 document 排序field 值相同不同的 shard 上可能排序不同每次请求轮询打到不同的 replica shard 上每次页面上看到的搜索结果的排序都不一样。这就是 bouncing result也就是跳跃的结果。 搜索的时候是轮询将搜索请求发送到每一个 replica shardprimary shard但是在不同的 shard 上可能 document 的排序不同 解决方案就是将 preference 设置为一个字符串比如说 user_id让每个 user 每次搜索的时候都使用同一个 replica shard 去执行就不会看到 bouncing results 了 timeout: 主要就是限定在一定时间内将部分获取到的数据直接返回避免查询耗时过长 routing: document 文档路由_id 路由routinguser_id这样的话可以让同一个 user 对应的数据到一个 shard 上去 search_type: defaultquery_then_fetch dfs_query_then_fetch可以提升 revelance sort 精准度 9.bucket 和 metric bucket:一个数据分组 city name 北京 张三 北京 李四 天津 王五 天津 赵六 天津 王麻子 划分出来两个 bucket一个是北京 bucket一个是天津 bucket 北京 bucket包含了 2 个人张三李四 上海 bucket包含了 3 个人王五赵六王麻子 metric:对一个数据分组执行的统计 metric就是对一个 bucket 执行的某种聚合分析的操作比如说求平均值求最大值求最小值 select count(*) from book group by studymodelbucketgroup by studymodel -- 那些 studymodel 相同的数据就会被划分到一个 bucket 中metriccount(*)对每个 user_id bucket 中所有的数据计算一个数量。还有 avg()sum()max()min() 觉得有用的话点个赞 呗。 ❤️❤️❤️本人水平有限如有纰漏欢迎各位大佬评论批评指正 如果觉得这篇文对你有帮助的话也请给个点赞、收藏下吧非常感谢! Stay Hungry Stay Foolish 道阻且长,行则将至,让我们一起加油吧
http://www.ho-use.cn/article/10812607.html

相关文章:

  • 桂林景区网站建设策划方案网站建设商城网站
  • 平台类网站有哪些免费注册网站云空间
  • 绵阳集团网站建设什么是网络推广营销
  • html网站开发心得体会中国菲律宾足球
  • 如何用front怕个做网站怎么做盗版电影网站
  • 南京科技网站设计费用wordpress修改我要注册链接
  • 东莞网站优化排名网站建设咨询客户话术
  • 龙华网站建设方案咨询深圳外贸公司招聘信息
  • 中国建设银行官方网站下载优设网站怎么下载
  • 赣县网站制作浦东网站制作
  • 动态数据库网站装修公司名字大全参考免费
  • 云存储能用来做网站吗苏州学做网站
  • 微信如何做微商城网站建设wordpress sql替换域名
  • 建立网站地图wordpress表单提交的邮箱
  • 网站做app的软件叫什么品牌加盟最好的网站建设
  • 长沙网站服务器263个人登录入口
  • 杭州建设网站职称人才工作专题网站sem托管
  • 建设网站证书查询宝塔网站建设教程
  • 郑州修了你官方网站网站做seo收录
  • 网站开发过程的分工潍坊logo设计公司
  • 网站建设实验报告手写十大不收费看盘软件网站
  • 厦门企业网站开发中国还有多少人没有打新冠疫苗
  • 南宁做网站的有几家网站建设答辩内容
  • 自己做卖东西网站惠州seo
  • 网站的交互体验网站上的二维码
  • 网站建设技巧亅金手指排名25网页设计与制作100例怎么写
  • 婚庆公司网站建设方案做外贸女装有哪些网站有哪些
  • 佛山做网站-准度科技公司湖南人文科技学院宿舍
  • 网站备案查询 whois做网站用的
  • 网站后台管理界面下载软件定制开发app