以下為東華書局 出版的「RPA 入門與應用 - 機器人流程自動化」案例3-2 網頁資訊擷取 的設定步驟。因為UiPath一直在改版,所以購買的書籍中之操作步驟已和現在的版本Uipath 2023.10.1不同了。以下就以此版本下去記錄設定步驟。
■ 資源準備
前往網站 https://quotes.toscrape.com/
步驟一:在StudioX DESIGN畫面點選「Table Extraction」
步驟二:在以下視窗「Select Data to Extract」
步驟三:到我們要擷取資料的網頁上。點到我們要擷取資料的地方。以範例為「名言」擷取,所以滑鼠直接點取「名言」所在之處。如下綠色標示之處。
只要點取一個名,系統自動會去判斷該網頁所有名言。
待系統執行完畢,點選「Confirm」即可。
步驟四:因為此範例是要抓取「名言」及「作者」,所以我們重覆上述步驟,但此次點選作者處即可。
步驟五:擷取的資料都設定完成後,只要點擊右方的齒輪,即可對資料的名稱做更改。如下圖我們則是將第一筆資料名稱改為「名言」
步驟六:若資料頁不只一頁時,則可①點擊下方的「Extract data from multiple pages」將其開啟。 ②點選Next Button。
步驟七:在網頁中找到下一頁的按鍵。本範例為下圖的綠色處。
步驟八:回到「DESIGN」畫面,到右方處切換到Data Manage
點選綠色處的⊕ → 黃色處的 Connect to a new Excel file。此步驟設定的目的,是要指定Extract Data的檔案。
點擊右方的紅色處,開啟我們想要存入擷取資料的檔案。
步驟九:在【Extract Table Data】中我們要設定Extract to的目的檔。 ①點綠色⊕
② 此處選擇我們要存檔的檔案,檔名則是在步驟八時所設定的名稱。 在此範例 選擇 _12345677 → Custom Input
③在新視窗中選「Sheet」→ 按「⊕」→ Text
④在Text Builder中輸入資料匯出後的工作頁名稱。
步驟十:使用【Use Excel File】→ 點選箭頭所指處的資料匣,選擇我們要存入的檔案即可。
底下即為成果。打開鄉們剛才的存檔,即可看到擷取的資料已經在理面
延伸閱讀
留言列表