웹 브라우저 (IE 또는 Chrome)를 사용하여 Ctl-S를 사용하여 웹 페이지 (.html)를 저장하고 텍스트 편집기로 검사하고 테이블 형식의 데이터를 볼 수 있습니다. 그 숫자 중 하나를 추출하고 싶지만 많은 웹 페이지에서 너무 많아 수동으로 할 수 없습니다. 그래서 WGET을 사용하여 웹 페이지를 하나씩 가져오고 .html을 구문 분석하고 원하는 숫자를 검색하는 다른 프로그램을 작성하고 싶습니다. 그러나 브라우저와 동일한 URL을 사용할 때 WGET에 의해 저장된 .html 파일에는 데이터 테이블이 없습니다. 왜 안돼? 마치 서버가 웹 브라우저가 아닌 WGET에서 요청을 감지하고 데이터 테이블이없는 스켈레톤 웹 페이지를 제공하는 것처럼 서버가 감지합니다. WGET을 사용하여 동일한 웹 페이지를 어떻게 얻을 수 있습니까? - 고마워!
더 많은 정보:
가져 오려는 URL의 예는 다음과 같습니다. http://performance.morningstar.com/fund/performance-return.action?t=ICENX®ion=usa&culture=en-US 여기서 문자열 ICENX는 뮤추얼 펀드 시세 기호입니다. 여러 가지 티커 기호로 변경됩니다. 브라우저에서 볼 때 데이터 테이블을 다운로드하지만 WGET으로 페치하면 데이터 테이블이 누락됩니다.