本文档对使用 ChatGPT 进行网络爬取进行了全面的回顾,并探讨了它的优势和其他可能的选择。
不幸的是,ChatGPT 目前无法自行浏览互联网来检索信息,因为它目前不具备与网页交互或理解基于网络的通信中使用的超文本传输协议 (HTTP) 的复杂性所需的能力。与其他方法一起使用时,ChatGPT 可以在网页抓取过程中为您带来优势。
ChatGPT 无法作为成熟的网络抓取服务发挥作用的主要原因可以解释如下:

ChatGPT 无法直接联系网络服务器,因此不允许
商城 任何访问或交互。这意味着数据和分析处理必须依赖于人工输入。

对 HTTP 理解不足 要从网页获取信息,用户需要理解和修改 HTTP 请求和响应。然而,ChatGPT 目前由于编程技能不足,还无法理解这些复杂的细节。

ChatGPT 的优势在于其生成和理解文本的能力。该技术有助于分析提取的信息,但无法覆盖整个网络抓取。