Jit-Browser Jit-4 平台的一部分 EN-CA |

HeadlessChrome101:Jit-Browser 如何將 Chrome 轉變為全功能多功能瀏覽器–伺服器-瀏覽器層

這是一個用簡單語言解釋 Jit-Browser 如何使用無頭 Chrome、如何使用專有的 Jit-TR 運行時,以及為了使其成為一流的瀏覽器功能而不是僅僅另一個腳本,還需要做什麼的指南。

從一個簡單的截圖工具到 Jit-Browser

我們從一個小的命令行工具開始: getpage https://example.com page.png. 它在 Docker 容器中啟動 Chrome,截取 example.com 的渲染頁面的截圖,然後退出。

有用的概念驗證。每次調用都是冷啟動。它對翻譯、會話或狀態一無所知。它只是一個無頭相機。

Jit-Browser 是下一步。它仍然使用真正的 Chrome,但現在:

  • 它記錄頁面內發生的事情。
  • 它注入 Jit-TR 腳本作為翻譯層。
  • 它可以遵循簡單的流程,如 cookie 橫幅或下拉菜單。
  • 它捕獲完全翻譯的 HTML,而不僅僅是截圖。

此頁面解釋了該管道,以便您可以看到我們不是在敷衍。我們展示了瀏覽器級別的多語言層實際上如何工作。

Jit-Browser 管道的 6 個步驟

在高層次上,每次捕獲都遵循相同的順序。

  1. 在 Docker 中啟動真正的 Chrome(無頭)。
    我們使用 Puppeteer (pptr.dev) 啟動驅動普通瀏覽器的相同引擎,但沒有可見窗口。沒有自定義解析器,沒有假渲染。
  2. 應用 cookie 或登錄狀態(如果已配置)。
    對於需要登錄會話的演示,我們重播您的 cookie。沒有暴力破解,沒有密碼猜測,沒有抓取我們無法控制的帳戶。
  3. 像用戶一樣精確加載目標頁面。
    HTML、CSS、JavaScript、字體、圖像。我們等待 networkidle2 (https://pptr.dev/api/puppeteer.page.waitfornetworkidle) 以便緩慢的包和字體可以完成加載。
  4. 注入 Jit-TR 片段作為一個層。
    我們添加一個指向我們專利申請中的運行時代碼的腳本標籤 – 例如: