Task01 认识八爪鱼 - By Shannon

1. 八爪鱼数据采集方式

  • 采用现有模板进行采集;
  • 自定义采集方式;

2. 八爪鱼数据采集流程

设置爬取网页→设置爬取流程和爬取字段→运行八爪鱼进行数据采集

3. 实践

① 使用模板采集36Kr关键词页面

② 使用自定义采集36Kr页面

4. 思考部分

① 体验了八爪鱼采集后,你觉得它能够用在学习和工作中的哪些方面?

  • 对于开始一个课题,可以通过八爪鱼,抓取关于该领域的所有文献。
  • 使用八爪鱼抓取相关领域的专业数据网站,保存为本地进行分析。

② 推测一下,你觉得八爪鱼的工作原理是什么?

  • 对页面内容进行字段分割,然后根据设置的字段抓取对应的数据。

3.和python爬虫相比,八爪鱼的优势和劣势是什么?

  • 优势:简单易操作,图形界面,上手快;
  • 劣势:自由度稍小;