GitHub - jooooock/wechat-article-exporter at 30f74395f09c104d53b5a1db49f34aff4c4f9e24

Branches Tags

Name		Name	Last commit message	Last commit date
Latest commit History 136 Commits
.github/workflows		.github/workflows
apis		apis
assets		assets
components		components
composables		composables
config		config
docs		docs
layouts		layouts
pages		pages
public		public
server		server
store		store
types		types
utils		utils
.gitignore		.gitignore
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
LICENSE		LICENSE
README.md		README.md
app.vue		app.vue
error.vue		error.vue
nuxt.config.ts		nuxt.config.ts
package.json		package.json
tailwind.config.js		tailwind.config.js
tsconfig.json		tsconfig.json
yarn.lock		yarn.lock

Repository files navigation

微信公众号文章导出工具，100%还原文章样式。

🎯 特性

🔨 使用

注册一个微信公众号 (已有账号的话跳过)

前往微信公众平台注册，服务号和订阅号皆可。

二维码扫码登录

进入登录页面，用微信扫描页面上的二维码，然后选择自己的公众号进行登录。

搜索目标公众号，开始下载文章

通过左上角的公众号切换按钮，搜索自己感兴趣的公众号，如下图所示：

🚀 私有部署

Warning

由于项目目前还没有进入稳定状态，所以如果进行了私有部署，请随时关注该项目的最新更新，特别是代理部分的变化，后续将会修改使用策略。

或者你可以修改config/index.ts中的AVAILABLE_PROXY_LIST变量，完全使用自己搭建的节点。

另外，目前只有部署到 Deno Deploy 的文档，如果需要部署到其他平台，请在 Issue 中说明。

部署到 Deno Deploy

Fork 该项目

点击 New Project 在 Deno Deploy 上面创建一个项目，选择你刚fork的仓库，如下图所示:

创建之后如下所示:

修改github仓库发布配置

启用仓库的 workflows (默认fork的仓库是禁用的):

修改.github/workflows/deno_deploy.yml:

提交:

等待发布结果

💡 原理

在公众号后台写文章时支持搜索其他公众号的文章功能，以此来实现抓取指定公众号所有文章的目的。

📢 关于批量导出

由于微信对相关接口有额度/频率的调用限制，所以批量导出功能并不会去批量获取新的数据，仅仅是将已缓存的数据导出。由于翻页时已经将数据进行了缓存，所以批量导出的数据即页面所显示的数据。

🌎 关于代理池

数据的下载采用代理池的思路，以便解决跨域、防盗链、加速等一系列问题。

目前有以下代理节点:

https://vproxy-01.deno.dev
https://vproxy-02.deno.dev
https://vproxy-03.deno.dev
https://vproxy-04.deno.dev
https://vproxy-05.deno.dev
https://vproxy-06.deno.dev
https://vproxy-01.jooooock.workers.dev
https://vproxy-02.jooooock.workers.dev

以上节点都是部署在 Deno Deploy / Cloudflare Workers 上面的免费账户中，算是白嫖了这些托管平台的流量。

代理节点越多，则下载速度越快。因此欢迎大家自己搭建一些节点，并进行共享。

目前这些节点是公开的，后续打算加入签名验证机制，防止被恶意盗刷。

代理节点代码 (未进行签名验证，请酌情使用):

Deno Deploy

function error(msg: Error | string) {
    return new Response(msg instanceof Error ? msg.message : msg, {
        status: 403,
    });
}

async function wfetch(url: string, opt: Record<string, string> = {}) {
    if (!opt) {
        opt = {};
    }
    const options: Record<string, any> = {
        method: "GET",
        headers: {
            "User-Agent":
                "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.0.0 Safari/537.36",
        },
    };
    if (opt.referer) {
        options.headers["Referer"] = opt.referer;
    }

    return await fetch(url, options);
}

Deno.serve(async (req: Request) => {
    if (req.method.toLowerCase() !== "get") {
        return error("Method not allowed");
    }

    const origin = req.headers.get("origin")!;
    const { searchParams } = new URL(req.url);
    let url = searchParams.get("url");
    if (!url) {
        return error("url cannot empty");
    }

    url = decodeURIComponent(url);
    console.log("proxy url:", url);

    if (!/^https?:\/\//.test(url)) {
        return error("url not valid");
    }

    const response = await wfetch(url);

    return new Response(response.body, {
        headers: {
            "Access-Control-Allow-Origin": origin,
            "Content-Type": response.headers.get("Content-Type")!,
        },
    });
});

Cloudflare Worker

function error(msg) {
    return new Response(msg instanceof Error ? msg.message : msg, {
        status: 403,
    });
}

async function wfetch(url, opt = {}) {
    if (!opt) {
        opt = {};
    }
    const options = {
        method: "GET",
        headers: {
            "User-Agent":
                "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.0.0 Safari/537.36",
        },
    };
    if (opt.referer) {
        options.headers["Referer"] = opt.referer;
    }

    return await fetch(url, options);
}


export default {
  async fetch(req, env, ctx) {
    if (req.method.toLowerCase() !== "get") {
        return error("Method not allowed");
    }

    const origin = req.headers.get("origin");
    const { searchParams } = new URL(req.url);
    let url = searchParams.get("url");
    if (!url) {
        return error("url cannot empty");
    }

    url = decodeURIComponent(url);
    console.log("proxy url:", url);

    if (!/^https?:\/\//.test(url)) {
        return error("url not valid");
    }

    const response = await wfetch(url);

    return new Response(response.body, {
        headers: {
            "Access-Control-Allow-Origin": origin,
            "Content-Type": response.headers.get("Content-Type"),
        },
    });
  },
};

❤️ 感谢

感谢 Deno Deploy、Cloudflare Workers 提供免费托管服务
感谢 WeChat_Article 项目提供原理思路

☕ 捐赠与支持

如果你觉得本项目帮助到了你，请给作者一个免费的 Star，也可以请作者喝杯咖啡，感谢你的支持！

⭐ Star 历史

📝 许可

MIT

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

微信公众号文章导出工具，100%还原文章样式。

🎯 特性

🔨 使用

🚀 私有部署

💡 原理

📢 关于批量导出

🌎 关于代理池

❤️ 感谢

☕ 捐赠与支持

⭐ Star 历史

📝 许可

About

Contributors 2

Languages

License

jooooock/wechat-article-exporter

Folders and files

Latest commit

History

Repository files navigation

微信公众号文章导出工具，100%还原文章样式。

🎯 特性

🔨 使用

🚀 私有部署

💡 原理

📢 关于批量导出

🌎 关于代理池

❤️ 感谢

☕ 捐赠与支持

⭐ Star 历史

📝 许可

About

Topics

Resources

License

Code of conduct

Stars

Watchers

Forks

Contributors 2

Languages