最新公告
  • 欢迎您光临IO源码网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • 搜索引擎 信息检索实践 PDF 下载

    搜索引擎  信息检索实践 PDF 下载

    本站整理下载:
    版权归出版社和原作者所有,链接已删除,请购买正版
     
     
    用户下载说明:
    电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
    http://product.dangdang.com/1880277003.html
      
    相关截图:

    资料简介:
    本书介绍了信息检索(IR)中的关键问题,以及这些问题如何影响搜索引擎的设计与实现,并且用数学模型强化了重要的概念。对于网络搜素引擎这一重要的话题,书中主要涵盖了在网络上广泛使用的搜索技术。
      本书适用于高等院校计算机科学或计算机工程专业的本科生、研究生,对于专业人士而言,本书也不失为一本理想的入门教材

    资料目录:
    出版者的话 
    译者序 
    前言 
    第1章 搜索引擎和信息检索 
     1.1 什么是信息检索 
     1.2 重要问题 
     1.3 搜索引擎 
     1.4 搜索工程师 
     参考文献和深入阅读 
     练习 
    第2章 搜索引擎的架构 
     2.1 什么是软件架构 
     2.2 基本的构件 
     2.3 组件及其功能 
      2.3.1 文本采集 
      2.3.2 文本转换 
      2.3.3 索引的创建 
      2.3.4 用户交互 
      2.3.5 排序 
      2.3.6 评价 
     2.4 搜索引擎是如何工作的 
     参考文献和深入阅读 
     练习 
    第3章 信息采集和信息源 
     3.1 确定搜索的内容 
     3.2 网络信息爬取 
      3.2.1 抓取网页 
      3.2.2 网络爬虫 
      3.2.3 时新性 
      3.2.4 面向主题的信息采集 
      3.2.5 深层网络 
      3.2.6 网站地图 
      3.2.7 分布式信息采集 
     3.3 文档和电子邮件的信息采集 
     3.4 文档信息源 
     3.5 转换问题 
     3.6 存储文档 
      3.6.1 使用数据库系统 
      3.6.2 随机存取 
      3.6.3 压缩和大规模文件 
      3.6.4 更新 
       3.6.5 BigTable 
     3.7 重复检测 
     3.8 去除噪声 
     参考文献和深入阅读 
     练习 
    第4章 文本处理 
     4.1 从词到词项 
     4.2 文本统计 
      4.2.1 词表增长 
      4.2.2 估计数据集和结果集大小 
     4.3 文档解析 
      4.3.1 概述 
      4.3.2 词素切分 
      4.3.3 停用词去除 
      4.3.4 词干提取 
      4.3.5 短语和n元串 
     4.4 文档结构和标记 
      4.5 链接分析 
      4.5.1 锚文本 
      4.5.2 PageRank 
      4.5.3 链接质量 
     4.6 信息抽取 
     4.7 国际化 
     参考文献和深入阅读 
     练习 
    第5章 基于索引的相关排序 
     5.1 概述 
     5.2 抽象的相关排序模型 
     5.3 倒排索引 
      5.3.1 文档 
      5.3.2 计数 
      5.3.3 位置 
      5.3.4 域与范围 
      5.3.5 分数 
      5.3.6 排列 
     5.4 压缩 
      5.4.1 熵与歧义 
      5.4.2 Delta编码 
      5.4.3 位对齐码 
      5.4.4 字节对齐码 
      5.4.5 实际应用中的压缩 
      5.4.6 展望 
      5.4.7 跳转和跳转指针 
     5.5 辅助结构 
     5.6 索引构建 
      5.6.1 简单构建 
      5.6.2 融合 
      5.6.3 并行与分布式 
      5.6.4 更新 
     5.7 查询处理 
      5.7.1 document-at-a-time评价 
      5.7.2 term-at-a-time评价 
      5.7.3 优化技术 
      5.7.4 结构化查询 
      5.7.5 分布式的评价 
      5.7.6 缓存 
     参考文献和深入阅读 
     练习 
    第6章 查询与界面 
     6.1 信息需求与查询 
     6.2 查询转换与提炼 
      6.2.1 停用词去除和词干提取 
      6.2.2 拼写检查和建议 
      6.2.3 查询扩展 
      6.2.4 相关反馈 
      6.2.5 上下文和个性化 
     6.3 搜索结果显示 
      6.3.1 搜索结果页面与页面摘要 
      6.3.2 广告与搜索 
      6.3.3 结果聚类 
     6.4 跨语言搜索 
     参考文献和深入阅读 
     练习 
    第7章 检索模型 
     7.1 检索模型概述 
      7.1.1 布尔检索 
      7.1.2 向量空间模型 
     7.2 概率模型 
      7.2.1 将信息检索作为分类问题 
      7.2.2 BM25排序算法 
     7.3 基于排序的语言模型 
      7.3.1 查询项似然排序 
      7.3.2 相关性模型和伪相关反馈 
     7.4 复杂查询和证据整合 
      7.4.1 推理网络模型 
      7.4.2 Galago查询语言 
     7.5 网络搜索 
     7.6 机器学习和信息检索 
      7.6.1 排序学习 
      7.6.2 主题模型和词汇不匹配 
     7.7 基于应用的模型 
     参考文献和深入阅读 
     练习 
    第8章 搜索引擎评价 
     8.1 搜索引擎评价的意义 
     8.2 评价语料 
     8.3 日志 
     8.4 效果评价 
      8.4.1 召回率和准确率 
      8.4.2 平均化和插值 
      8.4.3 关注排序靠前的文档 
      8.4.4 使用用户偏好 
     8.5 效率评价 
     8.6 训练、测试和统计 
      8.6.1 显著性检验 
      8.6.2 设置参数值 
      8.6.3 在线测试 
     8.7 基本要点 
     参考文献和深入阅读 
     练习 
    第9章 分类和聚类 
     9.1 分类 
      9.1.1 朴素贝叶斯 
      9.1.2 支持向量机 
      9.1.3 评价 
      9.1.4 分类器和特征选择 
      9.1.5 垃圾、情感及在线广告 
     9.2 聚类 
      9.2.1 层次聚类和K均值聚类 
      9.2.2 K近邻聚类 
      9.2.3 评价 
      9.2.4 如何选择K 
      9.2.5 聚类和搜索 
     参考文献和深入阅读 
     练习 
    第10章 社会化搜索 
     10.1 什么是社会化搜索 
     10.2 用户标签和人工索引 
      10.2.1 搜索标签 
      10.2.2 推测缺失的标签 
      10.2.3 浏览和标签云 
     10.3 社区内搜索 
      10.3.1 什么是社区 
      10.3.2 社区发现 
      10.3.3 基于社区的问答 
      10.3.4 协同搜索 
     10.4 过滤和推荐 
      10.4.1 文档过滤 
      10.4.2 协同过滤 
     10.5 P2P搜索和元搜索 
      10.5.1 分布式搜索 
      10.5.2 P2P网络 
     参考文献和深入阅读 
     练习 
    第11章 超越词袋 
     11.1 概述 
     11.2 基于特征的检索模型 
     11.3 词项依赖模型 
     11.4 再谈结构化 
      11.4.1 XML检索 
      11.4.2 实体搜索 
     11.5 问题越长,答案越好 
     11.6 词语、图片和音乐 
     11.7 搜索能否适用于所有情况 
     参考文献和深入阅读 
     练习 
    参考文献


     

    *** 次数:10600 已用完,请联系开发者***

    1. 本站所有资源来源于用户上传和网络,因此不包含技术服务请大家谅解!如有侵权请邮件联系客服!384324621@qq.com
    2. 本站不保证所提供下载的资源的准确性、安全性和完整性,资源仅供下载学习之用!如有链接无法下载、失效或广告,请联系客服处理,有奖励!
    3. 您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容资源!如用于商业或者非法用途,与本站无关,一切后果请用户自负!
    4. 如果您也有好的资源或教程,您可以投稿发布,成功分享后有★币奖励和额外收入!

    IO 源码网 » 搜索引擎 信息检索实践 PDF 下载

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    IO源码吧
    一个高级程序员模板开发平台

    发表评论

    • 104会员总数(位)
    • 11140资源总数(个)
    • 84本周发布(个)
    • 18 今日发布(个)
    • 449稳定运行(天)

    提供最优质的资源集合

    立即查看 了解详情