일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 스코페2021
- 프로그래머스 코딩테스트 연습문제
- WPF
- 프로그래머스 월간 코드 챌린지
- 프로그래머스 코딩테스트 연습
- Firefox
- git
- 프로그래머스 코딩 테스트 연습
- heroku
- 클린 코드
- Spring Boot
- github actions
- terraform
- 바이오데이터 엔지니어
- PostgreSQL 설치 시 에러
- Word Cloud
- 프로그래머스 월간 코드 챌린지 시즌1
- pycharm
- 애드센스
- 브랜디
- Codeforces
- Python
- github
- 스프링 부트와 AWS로 혼자 구현하는 웹 서비스
- c#
- FastAPI
- selenium
- 파이썬
- 디자인 패턴
- PostgreSQL
Archives
- Today
- Total
프로그래밍 연습하기
워드 클라우드 프로젝트 본문
반응형
간단한 토이 프로젝트를 하나 진행해봤습니다.
https://github.com/br-kim/Everytime
제가 만들어본 에브리타임 크롤링 클래스를 이용해서
대학생들이 많이 이용하는 커뮤니티인 에브리타임의 자유게시판 글을 크롤링 해온 뒤,
https://github.com/lovit/KR-WordRank
문장 토크나이징 없이 사용할 수 있는 lovit님의 KR-WordRank를 이용하여 주요 키워드의 빈도를 구할 수 있습니다.
https://pypi.org/project/wordcloud/
Word Cloud 패키지를 이용하면 위에서 얻은 데이터로 간단하게 워드 클라우드를 만들 수 있습니다.
https://github.com/br-kim/wordcloud_everytime
그렇게 해서 완성된 프로젝트 입니다.
자유게시판의 글 200개 가량으로 만들어 본 결과입니다.
위와 같은 결과를 얻을 수 있었습니다.
몇 번 테스트를 해본 결과, 자유게시판이라서 나누는 이야기가 다양해서 그런지
오히려 많은 글을 읽어오면 의미 있는 키워드를 얻기가 더 힘들어 졌던 것 같습니다.
프로젝트를 해보면서 느낀점은 제가 기존에 만들었던 크롤링 관련 클래스가
막상 따로 사용해볼려니까 문제점들이 많이 보였습니다.
그래서 이번 프로젝트에서만 일부 수정을 했는데, 나중에 클래스 자체를 다시 손봐야 될 것 같습니다.
반응형
'Python' 카테고리의 다른 글
파이썬 PriorityQueue(우선순위 큐) (0) | 2020.09.08 |
---|---|
초(Second)를 날짜(Date)로 바꾸기 (0) | 2020.07.31 |
고성능 파이썬(High Performance Python)을 읽고 (0) | 2019.11.18 |
Python Selenium으로 웹 페이지 인쇄 자동화 하기 (0) | 2019.07.05 |
Python에서 텍스트 안의 이모지(emoji)제거하기 (4) | 2019.04.06 |
Comments