Octoparse 是免費的用戶端 Windows Web 刮擦軟體,可將網站中的非結構化或半結構化資料轉換為結構化資料集,無需編碼。 它是一種易於使用的 Web 刮取工具,可從 Web 收集數據。在 Octoparse 中執行的爬網程式由配置的提取規則確定。提取規則將告訴 Octoparse:哪個網站將開放;您計劃爬網的數據在哪裡,等等提供高速數據收集,最多執行 10 個併發線程。 作為 Windows 應用程式,Octoparse 適用於靜態和動態網站,包括那些網頁正在使用 Ajax 的網站。您選擇的匯出格式有多種,如 CSV、EXCEL、HTML、TXT 和資料庫(MySQL、SQL Server 和 Oracle)。Octoparse 模擬人工操作以與網頁互動。 其顯著功能,如填寫表單,在文本框中輸入搜索詞等,將更容易提取網路數據。您可以在自己的電腦上(本地提取)或雲(雲提取)中運行提取專案。 Octoparse 提供了一個可視化操作窗格,它非常使用者友好和直接。Octoparse 模擬人類 Web 瀏覽行為,如打開網頁、登錄帳戶、輸入文本、指向並按一下 Web 元素等。只需在內置瀏覽器中點擊網站上的資訊並執行提取,即可獲得所需的結構化數據。 基於分散式計算同時大規模刮網是 Octoparse 最強大的功能。將配置專案上載到雲后,可以選擇使用多個雲端伺服器同時執行提取。如果您需要在短時間內刮取 10,000 個網頁,那麼 Octoparse 雲服務最適合您。
版本歷史記錄
- 版本 6.4.1 發佈於 2017-03-07
軟體細節
- 軟體分類: 網路與互聯網 > 網路監控
- 發佈者: Octopus Data Inc.
- 軟體性質: 免費
- 價格: N/A
- 版本: 6.4.1
- 作業系統: windows