2010年6月30日 星期三

抓取 Java Script 網頁

From: Julian Kuo
Sent: Tuesday, June 29, 2010 6:28 PM

看來這個網頁的數據資料是用如下的java script程式產生的,

根據Microsoft官網的說法 (用 Excel 從 Web 取得資料),
這類資料沒辦法用匯入的方式抓取
...
有些網頁會使用指令碼,以資料產生或填入表格。Excel 的 Web 查詢不支援這種類型的 Web 網頁。[Web 查詢] 對話方塊會使用 Windows Web 瀏覽套件來顯示 Web 網頁,讓您能選取您要的資料。在這個對話方塊中,任何指令碼或資料結合都非常緊密。但是,如果是為了初次匯入及後續更新而從站台讀取資料時,Excel 就不會使用這個套件。Excel 所能存取的唯一資訊是原始的 HTML 程式碼文字,因此在擷取資料之前,無法重新處理任何指令碼或資料結合。只是,如果您或您的公司都沒有 Web 網頁的控制權,就無法克服這項限制。但是,如果您可以控制 Web 網頁的內容,就可以使用上面所討論到的重新導向。


From: mikeon
Sent: Tuesday, June 29, 2010 7:47 PM

Morningstar的資料庫更改格式了
超過5年以上的內容好像要付費才能用
麻煩了


From: alfidpan
Sent: Wednesday, June 30, 2010 9:16 AM

這個附件是利用摘取網頁資料- getElementsByTagName 的方式拉資料的,
不會因為網頁是 java script而拉不下資料,
我這檔案是拼裝出來的,
這方面的專家是以下網站 Excel VBA Comics
這個方法的缺點是,執行速度會變慢,而且有可能因為防毒軟體而卡住,
但是可能是目前我所知道唯一可以拉下這網頁資料的方法。你參考看看。


From: mikeon
Sent: Thursday, July 01, 2010 7:50 AM

Dear 同學 桑:
美股盈再表修好了

因Morningstar資料庫大幅變更格式,
有些網頁甚至改用Java Script寫成
VBA抓不到這種格式
幸賴阿福桑大力幫忙,才能完成修復

感謝阿福桑 very much x 9999999999999

沒有留言:

張貼留言

注意:只有此網誌的成員可以留言。