기록공간

[TIL] 웹개발 종합반 3주 본문

TIL(Today I Learned)

[TIL] 웹개발 종합반 3주

mkm101 2023. 5. 10. 17:44
반응형

오늘은 지니 웹사이트에서 순위,제목,가수이름을 불러와 출력하는 법을 배웠다.

 

아래는 크롤링을 위한 VSCODE에서의 기본 세팅코드이다.

URL 부분에는, 지니뮤직 순위를보여주는 사이트를 입력했다.

from pymongo import MongoClient
client = MongoClient('mongodb+srv://sparta:test@cluster0.prmf9xh.mongodb.net/?retryWrites=true&w=majority')
db = client.dbsparta

import requests
from bs4 import BeautifulSoup

headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get(URL, headers=headers)
soup = BeautifulSoup(data.text, 'html.parser')


trs = soup.select('#body-content > div.newest-list > div > table > tbody > tr')



for tr in trs:
    title = tr.select_one('td.info > a.title.ellipsis ').text.strip()
    rank = tr.select_one('td.number').text[0:2].strip()
    artist = tr.select_one('.artist.ellipsis').text
    print(title,rank,artist)
   

실시간으로 결과가 보여지니까 재밌었지만, 아직 익숙치않아서 헤매는 부분이 많았다.

반응형

'TIL(Today I Learned)' 카테고리의 다른 글

[TIL] 05.12 개발일지  (0) 2023.05.12
[TIL] 웹개발 종합반 4주차  (0) 2023.05.11
[TIL] 웹개발 종합반 2주차  (0) 2023.05.09
[TIL] 웹개발 종합반 1주차  (0) 2023.05.08
[TIL] 05.04  (0) 2023.05.04