본문 바로가기

[Python] Colab에서 구글 드라이브 연동하기 from google.colab import drive drive.mount('/content/gdrive/') colab_path = '/content/gdrive/My Drive/Google Colaboratory/'
[Kaggle] kernel 내 plot에서 한글 깨짐 해결 import seaborn as sns import matplotlib.pyplot as plt import matplotlib as mpl import matplotlib.font_manager as fm plt.rcParams['axes.unicode_minus'] = False font_path = '/kaggle/input/nanum34/NanumSquareR.ttf' font_name = fm.FontProperties(fname=font_path, size=10)#.get_name() plt.rc('font', family=font_name.get_name()) ## plt 입력 시 fontproperties=font_name 매개변수 넣어주기 gnr_code_name_plot = sns.ba..
[Kaggle] kernel에서 data 추가하기 1. 오른쪽 위 화살표 클릭 후 '+Add data' 클릭 2. Search Datasets을 통해 이미 해당 데이터가 kaggle 내에 존재하는지 찾아보거나, 개인이 가지고 있는 데이터를 Upload한다. 3. Upload를 할 경우, dataset 명을 정하고 파일을 업로드한다. 이 때 이미 파일이 존재할 경우 아래와 같이 어떤 dataset에 존재하는지 알려준다.
[Review/Tableau] 플랜잇 데이터 시각화 커뮤니티 11기 후기 Tableau를 활용한 빅데이터 동아리 프로젝트를 진행하면서, Tableau 장인 팀원으로부터 알게된 플랜잇 데이터 시각화 커뮤니티! 이 플랜잇 데.시.커뮤니티는 BI컨설팅 회사이자 국내 최초 태블로 골드 파트너사인 '플랜잇'에서 진행하고 있는 커뮤니티로, Tableau를 현업에서 다루고 있거나 관심있게 배워보고 싶은 사람이라면 꼭 도전해볼 가치가 있다고 생각한다. 커뮤니티를 통해 배워가는 것도 많을 뿐더러, 얻어갈 수 있는 혜택이 많기 때문이다. (과제와 SNS 포스팅만 열심히 하면 플랜잇 교육을 계속 무료로 들을 수 있다는 점이 최고의 메리트..!) 모집은 플랜잇 네이버 블로그(https://blog.naver.com/withplanit)를 통해 진행되었다. 꼭 지원해보고 싶었기에 주기적으로 블로그를..
[Tableau] 태블로에서 다른 프로그래밍 언어 연동하기 https://help.tableau.com/current/pro/desktop/ko-kr/r_connection_manage.htm SCRIPT 함수를 이용하면 태블로에서 R, Python, MATLAB 등의 코드를 작성할 수 있다. input 변수들을 .arg1, .arg2 등으로 넣어주고, SCRIPT_REAL("코드",input1,input2,...) 와 같은 형태로 넣어주면 된다. 함수의 종류는 다음과 같다. 사용 예시 참고자료 : https://elearning.tableau.com/data-science-with-tableau/394817/scorm/20j9qqnfti1cr
[NLP] 자연어처리 기초 (for 기술면접 대비) Tokenization - corpus를 의미 있는 단위인 token으로 나누기 - 구두점, 특수문자 단순히 제외하면 안됨 Lemmatization & Stemming - Lemmatization : 표제어 추출 (뿌리 단어 찾기, am → be) - Stemming : 어간 추출 (going → go) Language Model - 단어 sequence에 확률을 부여하는 모델로, 이전 단어들 주어졌을 때 다음 단어 예측하는 모델 n-gram - 통계적 언어 모델에서 앞의 n개 단어 보고 확률 계산 BoW (Bag of Words) - 단어 순서를 고려하지 않고 출현 빈도만 고려 TF-IDF - DTM : 문서별 단어 빈도를 행렬로 표현 - tf(d,t) : 특정 문서 d에서 특정 단어 t가 나오는 횟수..
[ML] 머신러닝 기초 (for 기술면접 대비) 출처 : https://www.springboard.com/blog/machine-learning-interview-questions/ 머신러닝 기초 Bias & Variance - Bias : 참값과 추정값들의 차이 - Variance : 추정값들의 흩어진 정도 - train data에 bias를 최대한 낮출 경우 모델 복잡도가 높아져 variance가 커지고, variance를 줄이기 위해 모델 복잡도를 낮출 경우 bias가 높아지는 trade-off 관계가 존재 Supervised & Unsupervised ML - 지도 학습 (Supervised Learning) : 정답 알려주며 학습, label된 train data 필요, 분류 + 회귀 - 비지도 학습 (Unsupervised Learning..
[CS] Python 기초 (for 기술면접 대비) 출처 : https://www.edureka.co/blog/interview-questions/python-interview-questions/#basicinterviewquestions Python 기본 질문 list 와 tuple 의 차이 - list : 가변성, 더 느림 - tuple : 불변성(수정 불가), 더 빠름 Python 주요 특징 - interpreted language : 실행 전 컴파일이 필요 없음 - dynamically typed : 변수 사용 전 선언할 필요 없음 - 객체지향적 프로그래밍 : 상속 등과 함께 class(객체) 정의 허용 - 함수가 first-class object : 변수에 할당 가능, 다른 함수에서 반환 및 전달 가능 Scripting & Programming ..