他说:作为产品经理,不懂技术和代码也一样可以数据抓取

4 评论 12295 浏览 200 收藏 5 分钟

鉴于上一篇《第一个产品安装量破千万,我总结了这3句话》有人说没有干货,所以今天带来一篇诚意满满的干货。请自备酒水饮料。

先说一下我要做什么:为了解行业老大做线上手游陪玩业务的基本情况,想通过他们在app提供的月排行榜的数据,做初步营收相关的数据分析。

作为万能的产品经理,不懂技术和代码也一样可以数据抓取。

准备工作:

  1. 百度、bing必应
  2. charles或者其他的app抓包工具
  3. excel
  4. sublime(可以做一些基本的批量处理,没有也可以)

1. 获取源数据

大部分app中使用https链接,所以正常使用charles抓包之前,先安装描述文件。不然会出现乱码(先百度“charles教程”和“charles https 抓取”这几个关键字)

在抓到的URL中,选择json格式,我们需要的东西就在这里面,保存到sublime中内容如下(不知道这玩意要不要打码)

这里面更多的东西是跟我无关的,我需要的字段有这些:

nickname        用户昵称

property_value        游戏段位

gender        性别(1=男;2=女)

birthday        生日

city_name        城市

price        单价

nickname        昵称

order_count        订单量

跟这些没关系的统统过滤掉(工具:sublime、excel)。

汉字在 json 中显示的是 UNICODE 编码(别问我这是啥,我也不认识他),所以还需要把 UNICODE 编码转换成汉字,所以请百度“UNICODE 编码 转换”。

经过上面的工具,把得到的结果放到excel里面,得到如下内容:

至此,抓取过程结束。然后对数据进行加工。

2. 数据加工

我想要的数据是:

  • 总收入
  • 总订单
  • 人均收入
  • 投入时间
  • 订单量
  • 平均每单交易额
  • 用户基本属性(年龄、性别、城市分布)

其中投入时间、年龄、城市分布的信息是抓不到的。

估算投入产出比较重要的一个维度是时间,所以要先估算一个完成一笔交易要多久。

考虑到他们的段位在游戏里面都比较高,就算每局15分钟。也就是说完成一笔订单需要花费15分钟。

月排行第一名那哥们,接了2003单。对他来说,月薪30K,每天工作16.7个小时(当然,他可能是做外包)。

  • 出生日期经过简单的计算,可以得到年龄;
  • 找一份最新的全国城市排名,我用抓包得来的数据做匹配,城市分布搞定。

3. 数据分析

抓取的内容都是可以在app中可以看到的,抓取的目的,是不用自己手动计算排行里面500多个人的信息。所以这个算是免责声明吗?

对了,上个月也做了类似的分析,爬取了7w个页面。同样不需要懂代码,感兴趣的话我们下次聊聊吧。

 

作者:王也,产品经理(QQ/wx:867611672;个人公众号:野生产品经理),欢迎与我交流。ps:最近想换份工作

本文由 @王也 原创发布于人人都是产品经理。未经许可,禁止转载。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
海报
评论
评论请登录
  1. 不过详细一点就好了 看着容易其实操作起来emmm

    来自湖南 回复
  2. 太棒了8 正愁不懂代码怎么抓数据 正是雪中送炭

    来自湖南 回复
  3. 老王~写的很好

    回复
    1. 快说你是谁 😐

      来自上海 回复