본문 바로가기

Programming/WEB

Selenium을 사용한 구글 이미지 크롤링

사용언어 및 외부 라이브러리: 파이썬 3.9, Selenium, Chromedriver

 

사용방법: 검색하고자 하는 단어를 입력하면 그 단어 이름의 폴더가 생성되고,

폴더 안에 사진파일이 150개까지 저장된다. 이후 프로그램은 자동 종료.

 

venv를 사용했기 때문에 버전이 안 맞아서 꼬일 수도 있으므로 가상환경 구축해서 사용하길 권장.

 

덕질용 짤 모을 때 유용하게 쓰일듯

 

UI구현 + EXE 파일 생성이 최종목표

 

간단하게 코드 설명을 하자면

 

크롬 드라이버를 실행 후 기본 주소는 구글 이미지로 설정한다.

그리고 터미널에서 검색하고자 하는 키워드를 입력한다. 그럼 키워드가 search라는 변수에 저장되고 검색이 시작된다.

 

스크롤을 넘기기 위해 스크롤 길이를 구해준다. 왜냐하면

스크롤을 넘기다 보면 결과 더보기 라는 버튼이 나오는데, 이 버튼을 눌러서 페이지에 표시되는 이미지를

최대한 확보하기 위해서이다.

F12를 눌러 확인해보면 클래스 이름을 알 수 있다.
이 문구가 나올 때 까지 스크롤을 내려야 한다.

 

새폴더에 다운받을 이미지를 저장하기 위해 위와 같은 코드를 넣었다. "directorypath"에

폴더를 생성하고자 하는 경로를 입력한다. 그리고 입력한 키워드와 같은 이름의 폴더를 생성하기 위해

search를 더해주었다.

 

구글 이미지 검색에서 검색어(키워드)를 입력하면 이미지들이 검색결과로 나타나는데, 그걸 하나 하나 클릭해서

큰 이미지로 다운받기 위한 코드이다. os.chdir() 메서드는 현재 작업폴더 위치를 바꿔주는 메서드인데, 나 같은 경우는 저걸 추가하지 않으면 작업 폴더가 바뀌지 않아서 추가 해주었다. 

 

github.com/Uoaki/ImageDown

 

 

'Programming > WEB' 카테고리의 다른 글

Teachable Machine을 활용한 웹페이지만들기  (0) 2021.04.01