GitHub - yanglfree/qingteng_love: 青x之恋小程序破解批量获取数据，并分析

qingteng_love

本文仅做学习研究，请勿用在任何商业用途

青x之恋小程序逆向批量获取数据，并分析

Score

青x之恋是一款最近比较火的小程序，标签，高学历交友。学历都真实可查，并且资料的审核很严格。我个人还是很喜欢这款小程序的，还推荐过给身边的朋友使用，别人还在上面找到了另一半，很神奇。

青x之恋，每天只推荐5个用户，这让人很抓狂，有没有办法，破解一下，多看一些用户呢？带着这个目的，我研究了一下。最后的结果是，确实只推荐5个，但是，我可以把一定量的用户数据download下来，不过这样只能看看，研究下数据，不能去进行like，私信等操作。有了这个就够了，反正，我也只是为了研究一下相关的数据。看下青x之恋上面到底有多少用户，用户的学历，年龄，地域，行业等等。

抓包

第一步，首先就是抓包。这里，我用的是mitmproxy。相关的介绍和使用请参考其他资料。抓包的结果：

上图显示的是推荐列表这个接口。参数只有一个platform=2,这个应该是iOS平台的，其他的参数都没有了，然后header中还有几个重要的参数需要重点关注。

authorization

这个是登录认证，登录成功后，应该都会有这个参数，固定的。

appversion

这个参数应该也是有用的，在后面源码中看到了相关的设置

user-agent

这个不用说了，后面用python来爬数据肯定是需要的

sign

然后最重要的就是这个sign了，是一个加密的签名。根据我自己的摸索，不同的接口这个参数是不一样的，所以这个加密跟接口的名称是有关系的。当然具体是怎么来的，这个就只能去小程序的源码中一探究竟了。

小程序源码

获取小程序源码，网上也有相关资料，我这里用一台root了的Android手机，也拿到了小程序的wapkg文件，反编译后得到了一份不算完整的源码。然后就可以在这里面找sign的具体实现了。直接把报错部分的代码注释掉，保留没问题的代码，然后在代码中断点，微信开发工具上面直接编译，就可以进行debug操作了。因为小程序刚启动的时候就会调用api接口，所以，一开始就可以debug到接口加密的地方，发现了Sign生成的地方。最后找到了这段代码，这个地方就是获取签名的过程，用的是SHA-1算法，用的是jssha这个第三方库来进行加密的。关于这个库，有个网站可以直接测试加密结果，很方便，调试的时候可以测试。

https://caligatio.github.io/jsSHA/

批量获取sign

有了sign的获取逻辑，就可以批量获取sign了。因为这个地方要用到js的第三方库jssha（试了下python下的三方库，加密方式有区别，不能得到正确的sign。jssha这个地方，输入类型用的是‘TEXT’方式，输出用的base_64，python下面输入只能用二进制）这里，我先在JavaScript中批量获取sign存入mongo中，后面在python中读取mongo，得到sign和target_id。

function get_sign(user_id, message) {
    //根据url params method生成sign签名
    var sha = new jsSHA("SHA-1", "TEXT");
    sha.setHMACKey(SECRET_KEY, "TEXT");
    sha.update(message.join("&"));
    sign = sha.getHMAC("B64");
    return sign;
}

这里的SECRET_KEY就是HMAC加密中的盐

得到的sign保存到mongo中是这样的：因为sign和target_id是一一对应的，所以这里用了一个“：”把两个连接起来保存了，后面就可以很方便的取出，保证一一对应，加了一个target_id字段是为了后面能够根据id来查询sign

最后，根据上面的一顿操作，Sign就可以拿到了，经过跟前面抓包工具得到的数据比对，完全ok。有了sign，然后，就可以干点事了。

request请求获取用户信息

有了sign，获取用户个人信息毫无压力了。构造request请求，获取具体某个用户的信息,并存入mongo中

def get_user_info(sign, target_uid):
    url = host + "/user/get_user_info"
    headers={
        "content-type": "application/x-www-form-urlencoded",
        "AppVersion": "2.2.3",
        "Sign":sign, 
        "authorization": "你自己的认证信息",
        "user-agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 12_3_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/15E148 MicroMessenger/7.0.5(0x17000523) NetType/WIFI Language/zh_CN"
    }

    params = {
        "target_uid": target_uid,
        "platform": 2
    }
    try:
        response = requests.post(url,data=params,headers= headers,stream=False,timeout=20)
        user_json = json.loads(response.text)
        user_json = user_json["data"]
        # print(user_json)
        # uid为0 无效用户 过滤掉
        if user_json["uid"] == 0:
            print('无效用户')
            return
        # 注销用户 过滤掉
        if user_json["nickname"] == "用户已注销":
            print('已注销用户')
            return
        # 学校级别
        school_level = user_json["school_level"]
        if school_level == 0:
            school_level_str = "无"
        if school_level == 1:
            school_level_str = "211及以上"
        elif school_level == 2:
            school_level_str = "一本"
        elif school_level == 3:
            school_level_str = "普通本科"
        elif school_level == 4:
            school_level_str = "专科"

        # 性别
        gender = user_json["gender"]
        if gender == 1:
            gender_str = "男"
        else:
            gender_str = "女"
 
        user = {
            "uid": user_json["uid"],
            "nickname": user_json["nickname"],
            "gender": gender_str,
            "avatar_url": user_json["avatar_url"],
            "birthday": user_json["birthday"],
            "age":user_json["age"],
            "province": user_json["province"],
            "city": user_json["city"],
            "phone": user_json["phone"],
            "school": user_json["school"],
            "school_level": user_json["school_level"],
            "school_level_str": school_level_str,
            "education": user_json["education"],
            "education_type": user_json["education_type"],
            "stature": user_json["stature"],
            "wid": user_json["wid"],
            "about_me": user_json["about_me"],
            "hobbies": user_json["hobbies"],
            "emotional_view": user_json["emotional_view"],
            "about_half": user_json["about_half"],
            "annual_salary": user_json["annual_salary"],
            "is_show": user_json["is_show"],
            "photos": user_json["photos"],
            "check_status": user_json["check_status"],
            "profession": user_json["profession"],
            "inviter": user_json["inviter"],
            "horoscope": user_json["horoscope"],
            "is_vip": user_json["is_vip"],
            "wxid": user_json["wxid"],
            "is_show_vip": user_json["is_show_vip"],
            "photo_list": user_json["photo_list"],
            "is_liked": user_json["is_liked"],
            "is_super_liked": user_json["is_super_liked"],
            "two_way_like": user_json["two_way_like"],
            "moment_photos": user_json["moment_photos"],
            "moment_total": user_json["moment_total"],
            "refuse_reason": user_json["refuse_reason"]
        }
        # condition = {'uid':user["uid"]}   更新
        # db.user_info.update_one(condition, {'$set':user})
        db.user_info.insert_one(user)
        response.close()
        print("mongo保存成功")
    except Exception as e:
        print('Error is----------', e)

批量获取

批量获取并存入MongoDB 从数据库中读取批量的sign，然后遍历获取每个用户的信息

def get_info_sign(start, end):
    # mongo中取出sign和user_id拼接的字符串 拆开后即可构建header中的sign和param的target_uid
    datas = db.user_info_signs.find({"target_id":{'$gte':start, '$lte':end}})
    # datas = db.user_info_signs.find({"target_id":20000})
    for data in datas:
        # 睡眠1~3秒 开始睡眠是担心被反爬，后来发现并没有，所以取消了睡眠
        # time.sleep(random.randint(1,3))
        # time.sleep(1)
        strs = data["sign"].split(":")
        sign = strs[0]
        target_uid = strs[1]
        print('sign is', sign, 'target_uid is ', target_uid)
        get_user_info(sign, target_uid)

可以干点什么？

现在，有了海量的用户数据，可以干点什么呢？嘿嘿，可以干的事情还真不少。首先，突破每天看5个用户的局限，系统每天只推荐5个用户，而且这5个用户里面一般只有一两个是VIP用户，效率有点低啊，这样相亲何时是个头啊，况且就算买了VIP，每天也只能看10个，太少了。现在，有了这些数据，那就没有什么限制了。

db.getCollection('user_info').find({'gender':'女','is_vip':true, 'city':'武汉'})

查一个，走起。不得不说，VIP用户的综合素质高多了，而且基本都是经过了认证的用户。

比如想查某个具体用户,知道青x号就可以查到了

db.getCollection('user_info').find({'uid':'xxxx'})

甚至，你不知道某人的id，直接可以根据头像去查找一个用户,因为每个用户的头像url是唯一的

db.getCollection('user_info').find({'avatar_url':'xxxx'})

还可以为你喜欢的某人手动点喜欢把uid拿去生成sign，然后去发请求，手动点喜欢的api是 /like/add_like 使用requests构造POST 请求

url = host + '/like/add_like'
params={
    'platform': 2,
    'target_id': xxx
}
requests.post(url, headers=headers, data=params)

用matplotlib绘图

有了海量的数据，还可以做下数据分析。根据这些数据，可以看下地域，学历，年龄，身高，性别，VIP用户，隐藏用户，还可以从关于里面查关键字来看下婚恋观等等。用matplotlib画饼状图，柱状图，一目了然。

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Score

抓包

authorization

appversion

user-agent

sign

小程序源码

批量获取sign

request请求获取用户信息

批量获取

可以干点什么？

用matplotlib绘图

About

Releases

Packages

yanglfree/qingteng_love

Folders and files

Latest commit

History

Repository files navigation

Score

抓包

authorization

appversion

user-agent

sign

小程序源码

批量获取sign

request请求获取用户信息

批量获取

可以干点什么？

用matplotlib绘图

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages