回来

快速提示:无头网页抓取

快速提示:无头网页抓取

在这一节中,我们将看看从web应用程序中提取文本的两种方法——包括一个独特的REST web Services包应用程序来执行无浏览器的web抓取。

视频回顾:

  1. 录音机
    1. 使用记录仪与自动任何地方Chrome扩展突出显示网页上的对象,并提取他们。yabo怎么登录不上去
    2. 记录器操作需要一个已建立的浏览器会话来进行交互。
    3. 对于需要在多个页面中进行导航或者在运行时动态加载页面上的对象的情况,记录器是一个很好的选择。
  2. 得到休息
    1. 使用REST Get方法来读取整个页面的HTML,而不需要浏览器(返回为字典),其中Body是完整HTML文本的字典键。
    2. 字符串包可以随后用于从REST响应中提取特定的文本。

小贴士

当使用REST Get方法返回页面的完整HTML或使用Recorder Capture操作返回对象的innerHTML时,请考虑将它们与String Split操作配对。字符串分割将允许您将可能重复的HTML元素转换成一个列表,可以通过迭代从重复div中提取内容,使其看起来像一个表或引导样式的卡片,在整个页面中重复。

请继续关注developer.automationanywhere.com获取更多快速技巧!

Baidu