收费插件不顶用?手把手教你零代码在 VPS 搭建亚马逊专属爬虫!


💎 为什么我们要执着于自己爬评论?

做跨境电商的都知道,亚马逊的买家评论是产品迭代的“黄金密码”,竞品的痛点全藏在那些冗长的差评里。但最近大家肯定深有体会:之前好用的 Shulex、卖家精灵等收费插件,现在经常“拉胯”,导不出完整的评论,不是断点就是残缺。

其实,靠别人不如靠自己!自己动手搞一套爬虫,不仅完全免费,还能不受三方工具限制,尽可能多地把海量评论一次性抓干净。此外,相比拿自己的办公电脑一跑好几个小时、稍微断个网就前功尽弃的本地爬虫实验,把程序扔到海外的 VPS云服务器 上执行才是终极方案——24小时不受打扰运作,还极大降低了本地网络的封号风险。

🛠️ 硬核架构:在VPS上我们部署了什么?

在服务器上搭一套私人爬虫,其实逻辑非常清晰。以我们最近上线的自动化系统为例,整个云端部署的核心经历了这几个步骤:

  1. **语言与环境基建:**登录装载 Linux 操作系统的 VPS 控制台,安装好 Node.js 和 Python 双环境,并配置强大的自动化防风控利器 —— Playwright 无头浏览器环境。
  2. **后端 API 与解析:**利用 Express 搭建提供 Web 服务的后端 API 接口。当接收到请求,系统会唤起 Python 脚本深度伪装真人翻页请求,避开平台机器验证提取评论节点数据。
  3. **数据清洗化表格:**单有 JSON 文本还不够运营分析,引入 node 端的 xlsx 等依赖模块,立刻把凌乱的 JSON 字符转化成直接能用来下钻透视的 CSV、Excel 数据表流文件并支持下载。
  4. **systemctl 进程守护:**在系统底层配置专用的应用驻留(例如 yellow-editor.service),哪怕关闭终端,主进程也能在后台永不息灭地稳定接单运行。

🤖 摊牌了:这么牛的操作全都是 AI 干的!

看到上面这些 NodeAPI、正则表达式、Linux 进程配置,是不是觉得头都大了?哈哈!实不相瞒——以上这些看似极其硬核高端的操作和文件代码,我一行都没有亲手敲过!真正干活的,全是 AI!

在这个无代码时代,我每天的工作就像个“冷酷的甲方老板”,遇到 500 服务器崩溃直接把报错日志复制甩给 AI,呵斥它“怎么跑不起来了,把修好的命令行发给我”。几秒钟后,这个不用发工资的顶级牛马程序员就把整套修复脚本和系统命令喂到了我嘴边。兄弟们,学代码的时代已经过去了,学会对 AI 提需求,你就是全栈开发带佬!

嫌服务器折腾麻烦?没问题!那套被 AI 毒打测试好几轮的成果已经上线在此,点击就能一键抓取成出 Excel 和 CSV 表格:

👉 点击立刻提取:yellows.online

⚠️ 必须必看:如何导出亚马逊 Cookies?

亚马逊的反扒极严,最稳妥的抓取方式是使用你自己的真实账号登录信息(也就是网页 Cookie)进行掩护。导出并喂给爬虫的步骤如下:

  1. 在电脑 Chrome 或 Edge 浏览器安装插件名叫做 Cookie-EditorEditThisCookie
  2. 打开亚马逊前台网站,确保你在这个页面已经登录了你的常规(或买家)账号。
  3. 点击浏览器右上角刚才装好的插件图标,在弹出的窗口里点击 Export (导出为 JSON) 按钮。
  4. 来到上方的 yellows.online 控制台,将复制下来的这长串代码一键粘贴,你就可以随心所欲、肆无忌惮地满速下载完整的 Excel 评论报表啦!