「docker实战篇」python的docker-打造多任务端app应用数据抓取系统（上）（34）

阅读量：364 次

发布时间：2019-03-04

本文共 1204 字，大约阅读时间需要 4 分钟。

Docker实战篇：Python爬虫+Docker容器化应用开发

系统概述

本文将介绍如何通过Docker技术实现一个多任务端应用抓取系统，涵盖抖音、快手和今日头条的数据获取需求。系统将基于现有的dockerpython源码进行优化和扩展，最终实现自动化爬虫任务。

模块化抓取任务

系统主要包含以下功能模块：

抖音视频作者数据抓取

快手视频作者数据抓取

今日头条推荐板块新闻抓取

每个模块将通过对应的Python脚本实现，脚本将利用Appium框架对Android模拟器进行操作，完成特定功能的自动化操作。

系统架构

1. 容器化镜像构建

通过Dockerfile构建镜像，镜像将包含以下关键组件：

MongoDB数据库（用于数据存储）

Appium框架（用于Android模拟器控制）

Python环境（支持爬虫脚本运行）

依赖库（包括Selenium、PyMongo等）

镜像构建完成后，将通过Docker Compose快速启动多个容器，实现高效开发和部署。

2. 容器化部署

系统部署将遵循以下步骤：

镜像下载

下载并安装MongoDB镜像

下载Appium镜像

导入自定义Python镜像

网络配置

在虚拟机环境中配置网络权限

确保各容器间通信畅通

文件共享

通过Vagrant共享文件夹

挂载共享文件夹至虚拟机

3. 系统运行优化

系统运行将基于以下关键技术：

多进程处理：通过多进程实现并发抓取

容器化管理：利用Docker管理容器生命周期

数据持久化：通过MongoDB实现数据存储

技术实现

1. 容器化环境配置

通过Vagrant脚本实现虚拟机配置，确保开发环境一致性。虚拟机将安装：

Docker引擎

Docker Compose

MongoDB

Appium

2. 容器化脚本

Dockerfile配置

# 定义镜像名称镜像名称: dockerpython# 基础系统安装从 basecentos:latest 镜像拉取# 安装必要软件运行命令：    yum update    yum安装kernel-headers kernel-devel# 挂载共享文件夹运行命令：    mount -t vboxsf handle_docker /root/docker/# 启动服务启动MongoDB和Appium服务

docker-compose配置

version: '3'services:    - mongodb    - appium    - python-appium

3. 模块功能扩展

通过对现有源码进行优化，实现以下功能：

模块化设计

高并发处理

数据存储优化

部署总结

通过以上步骤，可以快速搭建一个功能完善的多任务端应用抓取系统。系统不仅支持多平台数据抓取，还能通过容器化技术实现快速部署和扩展。接下来的工作将重点放在系统性能优化和数据处理流程的进一步完善上。

转载地址：http://zlpe.baihongyu.com/

你可能感兴趣的文章

OA让企业业务流程管理科学有“据”

OA项目之我的会议（会议排座&送审）

OA项目之我的会议（查询）

Object c将一个double值转换为时间格式

object detection之Win10配置

object detection训练自己数据

object detection错误Message type "object_detection.protos.SsdFeatureExtractor" has no field named "bat

object detection错误之Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR

object detection错误之no module named nets

Object of type 'ndarray' is not JSON serializable

Object Oriented Programming in JavaScript

object references an unsaved transient instance - save the transient instance before flushing

Object.assign用法

Object.keys（）的详解和用法

objectForKey与valueForKey在NSDictionary中的差异

Objective - C 小谈：消息机制的原理与使用

OBJECTIVE C (XCODE) 绘图功能简介（转载）

Objective-C ---JSON 解析和 KVC

Objective-C 编码规范