Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- 3장 확인문제
- 챗GPT 명령어 작성팁
- 인프런
- JAVA 기초
- Comparable과 Comparable
- 이것이 자바다
- 스프링 입문강의
- 조건문과 반복문
- 자바
- BFS
- 이것이 자바다 연습문제
- 트리 지름 구하기
- 이노캠
- 이것이 자바다 확인문제
- ArrayList 개념
- Java
- ChatGPT
- 웹개발 기본지식
- 자료구조
- 자바의 정석 6장
- 이노베이션캠프
- 객체지향
- 백준
- 이것이 자바다 13장
- Til
- 자바 언어 기초
- dfs
- 이노베이션캠프 동북
- 이노베이션 캠프
- 채팅GPT
Archives
- Today
- Total
기록공간
[TIL] 웹개발 종합반 3주 본문
반응형
오늘은 지니 웹사이트에서 순위,제목,가수이름을 불러와 출력하는 법을 배웠다.
아래는 크롤링을 위한 VSCODE에서의 기본 세팅코드이다.
URL 부분에는, 지니뮤직 순위를보여주는 사이트를 입력했다.
from pymongo import MongoClient
client = MongoClient('mongodb+srv://sparta:test@cluster0.prmf9xh.mongodb.net/?retryWrites=true&w=majority')
db = client.dbsparta
import requests
from bs4 import BeautifulSoup
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get(URL, headers=headers)
soup = BeautifulSoup(data.text, 'html.parser')
trs = soup.select('#body-content > div.newest-list > div > table > tbody > tr')
for tr in trs:
title = tr.select_one('td.info > a.title.ellipsis ').text.strip()
rank = tr.select_one('td.number').text[0:2].strip()
artist = tr.select_one('.artist.ellipsis').text
print(title,rank,artist)
실시간으로 결과가 보여지니까 재밌었지만, 아직 익숙치않아서 헤매는 부분이 많았다.
반응형
'TIL(Today I Learned)' 카테고리의 다른 글
[TIL] 05.12 개발일지 (0) | 2023.05.12 |
---|---|
[TIL] 웹개발 종합반 4주차 (0) | 2023.05.11 |
[TIL] 웹개발 종합반 2주차 (0) | 2023.05.09 |
[TIL] 웹개발 종합반 1주차 (0) | 2023.05.08 |
[TIL] 05.04 (0) | 2023.05.04 |