选择省份:

  • 中国

  • 选择城市:

    • Alternate Text 联系我们
    • 027-87500211
    • 返回顶部

    项目信息

    基于Python的大数据搜索引擎

    项目周期:5 (天)

    项目经理: 暂无

    项目督导: 暂无

    项目价格: 0.00

    简介:

    本项目为基于python的大数据搜索引擎项目,本项目使用使用python语句进行开发,使用到爬虫,Django等框架。

    项目介绍

  •          

    项目的根据:

    1)本项目的理论、实际意义

    2)综述国内外有关本项目的研究动态和自己的见解

    1.本项目研究的理论意义:

    Python大数据也是大数据分析最受欢迎的编程语言,Python是一个强大的,灵活的,开放的,易于学习的源语言,使用方便,并具有强大的数据操作和分析库。其简单的语法使编程新手很容易学习和掌握,经历过Matlab,,C / C++,java,或Visual Basic,Python提供了一个独特的组合,都能使用编程语言以及使用方便的分析和定量计算。

    Python语言它很容易上手,拥有快速成熟的数据挖掘能力,还有更实际的产品构建能力。Python语言也正在迅速地获得主流人士的拥护。只要你用过Python语言,你会发现它是更直观,并且更容易学习。它在计算机语言中的整体趋势也是上升的很快。使其在统计分析上的能力超越了之前的R语言。

    从对数据分析工作的处理上看,Python是中级规模数据处理的有力工具。丰富的数据交流社区也是 Python的优势,它提供了大量的Python工具包和特性。

    2.  本项目研究的实际意义:

    大数据是一个包括一切的术语,指的是数据集很大很复杂,他们需要特别设计的硬件和软件工具。数据集通常是 T 或者更大级别。这些数据集从各种各样的来源创建,包括传感器,收集气象信息,公开可用的信息,如杂志、报纸、文章。还包括购买交易记录、网络日志、医疗记录、军事侦察、视频和图像档案和大规模的电子商务等等。重点是针对当前网络上的各种搜索引擎而改良后的一种修补方式,从而使工作更有效率。

    3.国内外研究动态:

    针对国外对于搜索引擎的研究发现,如:

    谷歌搜索

    优点:世界上使用人数最多的英文搜索引擎,被认为效率最高最准确,排序也是  最科学的搜索引擎。

    缺点:Google中国于2010年退出中国大陆市场,将服务器搬离北京至香港,目前,大陆地区暂时无法使用。

    雅虎搜索引擎

    优点:世界上最早的搜索引擎之一,对国内用户而言,在Google不能用的情况下,可作为Google的替代品,主要用于查询英文资源。

    缺点:缺乏核心技术,搜索结果主要由Google和Bing等其他搜索引擎提供。

    Aol Search

    优点:主要针对美国国内用户,丰富的国内信息资源。

    缺点:过度本土化,不适合美国之外的用户。

    必应搜索

    优点:微软开发的搜索引擎,因与微软系统的IE浏览器捆绑,使用率比较高。

    缺点:对国内用户而言,IE使用率越来越低,Bing搜索用户较少。

    国内的基本就是1、百度搜索2、360搜素3、搜狗等等。有点相差无几。但是都有一共共同的致命级缺点,就是捆绑软件,恶意插件等等的渗透。

    4.个人见解:

    当今社会,人们都在努力让自己的生活从简,想着如何让自己去处理生活工作事物的时候更加方便,而Python恰巧易于学习,使用方便。Python简单又不失强大。和C/C++相比,不用做很多的底层工作,可以快速进行模型验证;和Java相比,Python语法简洁,表达能力强,同样的工作只需要1/3代码。 Python是最适合作为大学计算机科学编程课程使用的语言——MIT的计算机入门课程就是使用的Python——因为Python能够让人学到编程最重要的东西——如何解决问题。

  • 项目任务

  • 任务1 : 阅读项目原始需求,提交详细需求分析文档

  • 任务2 : 配置开发环境

  • 任务3 : 爬取大众点评网页

  • 任务4 : 从爬取的网页中提取有用的信息并在控制台打印

  • 任务5 : 把数据存储到sqlite3数据库 并在Django自带的admin后台管理页面显示

  • 地址:北京市海淀区中关村南大街36号12号楼18层1801号260 版权信息:北京百里半网络技术有限公司
    友情链接:厚溥教育