목록ETC (9)
류동균의 R 공부방입니다.
이번글에서는 Window10 환경에서 WSL로 Linux ubuntu 환경을 사용하는 글을 써보려한다. Linux환경에서 공부하거나 프로그래밍을 하고싶은데 AWS EC2인스턴스의 요금을 내기 부담스러울때, 회사에서 따로 Linux환경을 제공하지 않을 때 WSL을 사용하여 Linux환경을 구축하면 좋을 것 같다. WSL(Windows Subsystems for Linux)은 window10에서만 지원하며 ubuntu, centos, redhat 등 다양한 환경을 사용할 수 있으니 용도에 맞게 사용하면 될 것 같다. WSL 환경설정 Ubuntu를 다운받기 전에 WSL 환경설정이 필요하다. 1. 제어판으로 이동, 프로그램 및 기능 클릭 2. Windows 기능 켜기/끄기 클릭 3. Linux용 Windows ..
저번글에서 네이버 날씨를 크롤링하고 그것을 Rmd보고서로 작성후 html파일로 변환하는 블로그를 작성했었다. 이번에는 Linux의 crontab을 이용하여 이러한 보고서 특정시간에 반복적으로 생성되도록 자동화를 할 것이다. 링크 : 네이버 날씨 크롤링, Rmd보고서 작성 crontab 이란? 크론탭은 Linux환경에서 매일 혹은 매주 등 주기적으로 반복적인 작업을 요할 경우 작업을 예약하는 기능이다. # 크론탭 설정 * * * * * file 분 시 일 월 요일 실행할파일 분 : 0-59 시 : 0-23 일 : 0-31 월 : 1-12 요일 : 0-7 (0/7 = 일, 1 = 월 2 = 화 ...) crontab 명령어 crontab은 -e, -l, -r 3가지의 명령어가 있다. 사용법은 다음과 같다. ..
이번 블로그에서는 웹크롤링을 한번 해보려한다. 또한 이 글에 이어 다음글에서는 Linux crontab을 통한 업무 자동화 또한 간단히 해볼 예정인데 매일의 날씨를 알려주는 Rmd파일을 만들어보자. 그럼 바로 시작해보자. 크롤링 데이터 파악하기 날씨데이터는 다음의 URL에서 크롤링할 예정이다. URL에 접속하여 F12를 누르고 html을 확인해보자. 링크 : 네이버날씨 링크에 접속하면 서울경기 ... 제주 까지 전국의 날씨가 나오는 것을 확인 할 수 있다. html에서 이 데이터를 파악해보면 table태그에서 table의 class가 ".tbl_weather.tbl_today"로 나오는 것을 확인 할 수 있다. 결과적으로 우리가 크롤링해야 할 데이터는 필요없는 것들을 제외하고 ".tbl_weather.t..
외부파라미터를 받아 R파일에서 Rmd 파일을 호출하여 보고서를 저장하는 방식으로 작성해보려한다. 말이 어렵지만 그림으로 이해해보자. 이제 한번 리눅스에서 R파일을 실행하여 외부파라미터를 받아 html파일을 만들어보자. 이 작업에는 R, Rmd 두가지 유형의 파일을 만들어야 한다. 그럼 먼저 R파일부터 살펴보자. 필요한패키지 및 옵션 # R에서 Rmd를 호출하기위한 옵션 Sys.setenv(RSTUDIO_PANDOC="/usr/lib/rstudio-server/bin/pandoc") # 필요한패키지 library(rmarkdown) 외부 파라미터를 받고 Rdata로 저장 이제 R파일에서 외부에서 parameter를 받을수 있게 args를 설정해주어야한다. 그리고 필요한 parameter를 받고 Rdata로..
인터넷에 많은 파일들을 다운받아본적이 있을 것이다. 예를들어 기출문제 같은것을 사이트에서 다운받을때 일일이 특정회차 에 들어가 파일을 다운받고 또다시 다음회차글에 들어가 다운을받고 나오는 작업을 반복적으로 한 경험이 있을 것이다. 이러한 작업을 R 코드로 자동으로 해주는 방법이 있어 블로그에 글을 쓰게 되었다. 그럼 시작해보자 “최강 자격증 기출문제 전자문제집 CBT”이라는 곳에서 리눅스 마스터 2급 기출문제집을 다운받을 예정이다. (링크 : https://www.comcbt.com/xe/r2) 링크에 접속하면 다음과 같은 화면이 나올것이다. 우리가 필요한것은 빨간색으로 표시된 교사용, 학생용 파일이다. 폴더생성 파일을 다운로드 받기위해 폴더를 하나 생성해주어야 한다. 다음과 같이 실행해보자. 실행 했다..
트렐로(Trello)란 무엇인가? 트렐로란 프로젝트를 관리하는 툴이다. Boards에 마치 포스트잇을 붙여놓은 것처럼 일정 및 프로젝트 관리를 해주는 툴이다. 필자는 공부를 하고 있는 학생인데, 스터디를 할때 스터디 구성원 들과 사용중이다. 트렐로의 장점 트렐로의 장점이라고 하면 어떠한 프로젝트가 진행되는 상황을 간단하게 볼 수 있다는 점이다. 또한 어떠한 일정을 생성하고 라벨을 만들며 중요도에 따라 라벨의 색깔을 변화시킬 수도 있다. 직접사용해본다면 얼마나 쉽고 간단하고 직관적인지 알 수 있을 것이다. 또한 업무에 사용시 팀별로 여러가지 Borads를 생성하여 업무를 분할하여 프로젝트를 관리할 수 있다는 장점이 있다. 슬랙과의 연동 트렐로의 또다른 장점 중 하나는 슬랙과 연동할 수 있다는 점이다. 슬랙..