Crawling

Programing Language/Python

[Python] BeautifulSoup로 정적 웹 사이트 파싱하기

BeautifulSoup 아래와 같은 simple.html 파일이 있다. 이 파일을 파이썬에서 그대로 불러오고 싶을 때 사용하는 방법이 두 가지가 있다. header This is a paragraph 이것은 div 입니다 dog cat frog this apple banana 네이버 daum fish 제목 가격 1.이것이 파이썬이다 [도서] 19,200원 2.저것도 파이썬이다 [할인] 12,800원 3.그래도 파이썬인가? [중고] 6,500원 데이터 파싱 하기 우선 현재 경로에 있는 simple.html 내용을 가져오는 것이니 with as를 사용하여 파일 자체를 읽어온다. BeautifulSoup 파싱 라이브러리를 사용하면 손쉽게 html, json, xml 파일 등을 파싱 할 수 있다. In [7]..

밈아
'Crawling' 태그의 글 목록