본문 바로가기

python4

Python vs R 프로그래밍 장단점 및 활용 방법 Python과 R 소개 Python과 R은 데이터 과학, 통계, 머신 러닝, 인공 지능 등 다양한 분야에서 널리 사용되는 프로그래밍 언어로 알려져 있습니다. Python은 범용 프로그래밍 언어로 특히 교육에 특화된 언어로 알려져 있으며, R은 통계 및 데이터 분석에 특화된 언어로 알려져 있습니다. Python과 R의 장단점 Python: Python은 문법의 간결함과 다양한 라이브러리, 프레임워크의 지원으로 인해 초보자가 주로 접하는 언어 중 하나이며, 이미 많은 개발자들에게 선호되고 있습니다. 특히 다음과 같은 강점을 가지고 있습니다. 다목적 사용 범위: Python은 웹 개발, 자동화, 데이터 과학, AI(인공지능), 머신 러닝 등 다양한 분야에서 사용될 수 있습니다. 커뮤니티 및 생태계: 방대한 커.. 2024. 1. 15.
[Python] 초보도 가능한 로튼토마토(Rotten Tomatoes) 영화리뷰 크롤링: ④한 페이지의 전체 리뷰 크롤링하기 지난 장에는 하나의 리뷰를 크롤링하는 법을 함께 배웠다. 이번 장에는 한 페이지에 있는 리뷰 전체를 크롤링하는 법을 배워보자. 보통 페이지에서 리뷰를 보면 각 리뷰별로 구분이 되어있는데, 그 구분 기준을 찾는 것이 관건이다. 먼저 이전 장에서 배운 것처럼 페이지 소스에서 하나의 리뷰 상자가 어떤 기준으로 나뉘어 있는지 살펴보자. 위에서 처럼 하나의 리뷰 박스가 잡히는 구간에서 페이지 소스의 selector 주소를 카피해 보자. 그리고 파이썬에서 붙여 넣기를 하면 아래와 같이 주소가 나올 것이다. #content > div > div > div > div.review_table > div:nth-child(1) 여기서 nth-child(1)를 쉽게 직역하자면 '첫 번째 자식'이라는 뜻. 즉 리뷰의 첫 번째.. 2023. 2. 13.
[Python] 초보도 가능한 로튼토마토(Rotten Tomatoes) 영화리뷰 크롤링: ③ BeautifulSoup으로 리뷰 텍스트 가져오기 이번 장에서는 BeautifulSoup 패키지로 로튼토마토(Rotten Tomatoes) 영화리뷰를 긁어오자! 우선 BeautifulSoup이 뭘까? html 페이지 소스를 종류에 맞게 정리하는(parsing) 것을 가능하게 만드는 패키지가 바로 BeatufilSoup다. 이 역시 지난번 [Python] 왕초보도 가능한 로튼토마토(Rotten Tomatoes) 영화리뷰 크롤링: ② 셀레니움(selenium)으로 html 소스 가져오기 편에서 가져온 페이지소스를 활용하여 천천히 알아보자 1. BeautifulSoup 패키지 설치 먼저 BeautifulSoup 패키지가 없는 경우, 아래 코드를 terminal이나 cmd창에 입력해 설치하면 된다. pip install beautifulsoup4 설치가 완료되.. 2023. 2. 9.
[Python] 초보도 가능한 파이썬 입문: 아나콘다(Anaconda) 설치 파이썬에 입문을 원한다면 아나콘다(Anaconda)를 설치해 보자! 아는 사람은 알 테지만, 처음 들어본다면 당황스러운 그 이름 아나콘다?! 뱀을 연상케 하는 아나콘다는 단일 시스템 내에서 Python/R 데이터 과학 및 기계 학습을 수행할 수 있는 앱이다. 아나콘다를 설치하면 통합 개발 환경(IDE)과 함께 파이썬에서 쓰이는 기본 패키지들이 함께 다운로드할 수 있는 편의성이 있다. 통합 개발 환경(IDE)란 프로그래머가 소프트웨어 코드를 효율적으로 개발하도록 돕는 소프트웨어 애플리케이션이다. 즉, 파이썬 코드를 쓰고 해당 코드를 돌려볼 수 있는 창이다. 아나콘다에서 주로 쓰이는 IDE로는 pycharm, jupyter notebook, spyder가 있다. 아나콘다는 아래 사이트에서 설치 가능하다. h.. 2023. 2. 7.