2017년 1월 17일 화요일

[nodejs] nodejs 웹 파싱(크롤링) cheerio 사용하기

자바에 강려크한 jsoup 라는 웹파싱 api 가 존재 하듯이 nodejs 로 강려크한 추가 모듈이 존재한다. 이름하여 cheerio (입출력을 응원한다는 뜻인가...)


예제코드

var cheerio = require('cheerio');
var request = require('request');

위 두개의 의존 객체가 필요하다. 각 외부 라이브러리 다운 방법은 검색을 하기바람.

//아주 간단하다. url 경로를 지정하고 리퀘스트 함수를 호출후 result로 받는다.
function cheerioTest(){

    //역시 오류나서 죽을수 있기때문에 예외처리
    try{
                var url = '경로';
                request(url, function(error, response, result){

                //json스트링데이터일 경우.
//var jsonResult = JSON.parse(result);


});
    }catch (exception) {

    }
}



댓글 없음:

댓글 쓰기

[OS]리눅스서버 WAS 관련 권한 관리

[Best Practice] Linux 서버 WAS 권한 체계 구축 가이드 리눅스 환경에서 다수의 운영자가 WAS(Tomcat, Nginx 등)를 공동 관리할 때 발생하는 권한 꼬임(Permission Denied) 문제를 방지하기 위한 표준 설정...