方略学科导航

搜索结果: 1-1 共查到“信息处理技术 deep Web”相关记录1条 . 查询时间(0.093 秒)

基于MapReduce虚拟机的Deep Web数据源发现方法 MapReduce 虚拟机 Deep Web 数据源发现 2012/4/16

为了提高Deep Web爬虫发现和搜集数据源的效率，提出了一种融合MapReduce和虚拟化技术实现Deep Web海量数据挖掘的并行计算方法。基于MapReduce架构提出了一个Deep Web爬虫模型，通过链接过滤分类，页面过滤分类，表单过滤分类等3个MapReduce过程找到Deep Web数据源接口，并利用虚拟机构建单机集群进行性能测试。实验结果显示该方法可以实现大规模数据的并行处理，有效...