# book **Repository Path**: sunminghui/book ## Basic Information - **Project Name**: book - **Description**: My book - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2018-01-14 - **Last Updated**: 2020-12-18 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 《数据技术之美》 >《数据技术之美》--浅谈Elasticsearch 和 Lucene 背后的理论 ### 第一部分: 存储 * [索引与倒排索引](content/inverted-index/index.md) * [分片与副本](content/shard/index.md) * [集群中的选举机制](content/election/index.md) > 为什么Elasticsearch集群中一定要有一个master节点?它是必须的吗?没有master会怎样?master是什么时候产生的,又是怎么产生的呢? * [地理位置、音频索引]() ### 第一部分: 查询 * [搜索权重的利器TF-IDF和BM25](content/tfidf/index.md) > Lord Kelvin说“当你可以衡量所谈论的事情,并用数字来表达时,说明你知道这件事了;当你不能用数字来表达时,说明你的知识是微不足道的。” 如何量化并用数字来表示搜索呢? * [余弦相似度](content/cosine/index.md) * [分词与分析器]() * [查准率与查全率]() * [排名]() * [参考文档](ref.md) 世界上没有复杂的技术,只是缺少把它讲简单的人。 近几年,大数据技术火的一塌糊涂。但是,很多人都是在炒概念蹭热点,真正理解背后技术的人不多,而能理解清楚又能以简洁的方式讲出来的人则更少。 我喜欢这样的书,它能把大数据背后的原理以简单的方式讲清楚。这样的书市面上确实不多,不如自己写一本。