BS4... find() , find_all() > python

BS4... find() , find_all()

페이지 정보

작성자 서방님 댓글 0건 조회 249회 작성일 20-07-29 09:28

본문

>>> html = '''

<html>

<head> ........ '''

>>> from bs4 import BeautifulSoup

>>> bs = BeautifulSoup ( html , "html.parser" )

>>> print ( bs .perttify () ) # bs로 불러온 내용 보기

<html>

<head> .......

find, find_all

>>> bs . find ( 'title' ) # 태그값을 기준으로 내용 불러오기 (최초 검색 결과만 출력)

>>> bs. find_all ( 'p' ) # 해당 모든 태그를 불러온다 / [ 리스트 ]

[<p align.......> ......

>>> bs. find_all ( align = "center" ) # 속성값을 기준으로 태그를 불러온다

[ <p align = "center" .....

>>> bs. find_all ( 'p' , limit = 2 ) # 해당 모든 태그 중 2개 까지만

[<p align.......> ......

find(''). find('')

>>> head_tag = bs . find ( 'head' )

>>> head_tag . find ( 'title' ) # head 태그 내부 title 태그의 내용을 불러온다

>>> bs . find ( 'p' , align = "right" ) # p 태그 중 /and/ align = "right" 을 포함한 태그를 불러온다

>>> body_tag = bs . find ( 'body' )

>>> list1 = body_tag. find_all ( ['p','img'] ) # [] 리스트 , 'p' /or/ 'img' 를 포함하는 태그를 불러온다

>>> for tag in list1 :

print ( tag )

< p align....

< img height = "300" ......>

정규식 함수 활용

>>> import re

>>> bs. find_all ( re . compile ("^p") ) # p 글자를 포함하는 태그

>>> bs. find_all ( text = " text contents 1" ) # text contents 1 을 포함하는 태그

>>> bs. find_all ( text = re . compile (" text + ") ) # text 부가 내용 포함하는 태그

>>> bs. find_all ( re . compile ("^p") ) # p라는 글자를 포함하는 태그를 불러온다.

문장으로 가져오기

>>> tags = bs .find ('body') .find_all ('img')

>>> tags . string # string 은 1번에 1문자 씩만 변환가능

' img = 'cowboy.jpg' '

>>> strings = tags . string

>>> for string in strings :

print (string)

>>> body_tag = bs.find('body')

>>> body_tag. get_text() # 모든 문자열을 하나의 문자열로 되돌린다.

' \n text contents1 \n text contents 2 \n tex...... '

>>> body_tag. get_text ( strip = True ) # \n 줄바꿈 기호가 삭제된 채 출력

' text contents1 text contents 2 tex...... '

>>> body_tag. get_text ( '-' , strip = True ) # \n 기호가 '- 로 출력

' text contents1 - text contents 2 - tex...... '

댓글목록

등록된 댓글이 없습니다.

번호	제목	글쓴이	조회	날짜
15	파이썬을 위해 pycharm(파이참)을 써야만 하는 이유 5가지! #pycharm설치	서방님	291	06-09
14	Selenium 명령어	서방님	300	02-09
13	구글지도 데이터 수집하기	서방님	381	08-11
12	Pyinstaller를 PyCharm에 연결해서 사용하는 방법	서방님	310	07-30
11	[Python] 파이썬 MySQL연동, DB 엑셀 데이터 업로드 다운로드	서방님	310	07-29
10	엑셀 파일에 데이터 저장 (xlsx)	서방님	308	07-29
열람중	BS4... find() , find_all()	서방님	250	07-29
8	크롤링 예제. Lv3 자바스크립트 렌더링 크롤링 풀이	서방님	277	07-29
7	Javascript unescape()	서방님	275	07-28
6	초보자도 할 수 있는 품절 상품 구매 매크로 제작 (네이버 스토어)	서방님	1	07-28
5	파이썬 무료 동영상 강좌	서방님	282	07-22
4	프린트문print() 옵션(문자열 형식)	서방님	244	07-21
3	코드 실행시간 측정	서방님	254	07-21
2	크롤링	서방님	1	07-20
1	참고 url	서방님	1	07-20

BS4... find() , find_all() > python

인기검색어

python

BS4... find() , find_all()

페이지 정보

본문

댓글목록

notice

회원로그인

접속자집계