배우고 느끼고 생각하고 사랑하라

그리고 즐겨라

정리 25

[부스트캠프 AI Tech] Day 6

1) Introduction to Pytorch Pytorch 딥러닝 전 과정에서 쓰이는 가장 기본이 되는 프레임워크 Pytorch(facebook) vs Tensorflow(google) Keras wrapper(껍데기), High level API Tensorflow는 Static graph (Define and run) Pytorch는 Dynamic computation graph (자동미분시 실행 시점에서 그래프 정의) Computational Graph 연산의 과정을 그래프로 표현 Define and Run (Tensorflow) 그래프를 먼저 정의 -> 실행시점에 데이터 feed Define by Run (Pytorch) 실행을 하면서 그래프를 생성하는 방식 tensorflow Producti..

정리/부캠-2 2023.03.23

[다변량 데이터 분석] Chapter.02 Multiple Linear Regression

본 게시글은 강필성 교수님의 다변량 데이터 분석 강의를 기반으로 작성되었습니다. 작성자 : KUBIG 16기 최규빈 Chapter 2) Multiple Linear Regression Example 차량의 가격을 어떻게 예측할 수 있을까? Variable(X) Age, Color, Door, Weight, HP, KM... Target(y) Price Goal 정량적인 종속변수 Y와 여러 개의 설명변수 X 사이의 linear relationship을 찾는 것 Multiple은 p개의 설명변수가 존재한다는 의미 Regression은 y가 실수값이라는 의미 Linear은 y와 x 사이의 관계가 선형이라는 의미 $$ y = \beta_0 + \beta_1x_1 + \beta_2x_2 ... + \beta_dx..

[부스트캠프 AI Tech] Day 5

5) 딥러닝 학습방법 신경망 선형모델과 비선형함수의 결합 선형모델 O(n x p) = XW + b X(데이터 행렬, n x d) W(가중치행렬, d x p) b(절편, n x p) softmax 분류문제 해결에 이용하는 연산자 확률벡터 형태로 클래스 분류 학습할 때 사용 추론할 떄는 one-hot vector 사용 numpy overflow numpy는 너무 큰 값을 받을 때 overflow가 발생하므로 np.max를 활용해 해결 활성화함수 신경망은 선형모델과 활성함수(activation function)를 합성한 함수 자신의 노드에만 관여(softmax와는 다름) 활성화함수가 없다면 선형모델임 sigmoid 함수 tanh 함수 ReLU 함수 (max{0, x}) 다층 신경망 multi-layer per..

정리/부캠-1 2023.03.12

[부스트캠프 AI Tech] Day 4

과제 과제 내용은 비공개 Basic Math Numpy Pandas 벡터 행렬 경사하강법 딥러닝 학습 방법 베이즈 통계학 CNN RNN 1)Vector vector 숫자를 원소로 가지는 list 또는 array 공간에서의 한 점 원점으로부터의 상대적 위치 scalar를 곱하면 방향 변화 x, 길이만 변화 Norm 원점에서부터의 거리 L1 Norm : 절대값의 합, 맨하탄 거리 $$\begin{Vmatrix}L\ \end{Vmatrix}_1$$ L2 Norm : 제곱합의 제곱근, 유클리드 거리 $\begin{Vmatrix}L\ \end{Vmatrix}_2$ 벡터 사이의 거리 x 벡터와 y 벡터 사이의 거리는 벡터의 뺄셈을 이용해 구함 $\begin{Vmatrix}y-x\ \end{Vmatrix}$ 벡터 사..

정리/부캠-1 2023.03.12

[부스트캠프 AI Tech] Day 3

5)파이썬으로 데이터 다루기 5-1)File & Exception & Log handling exception 프로그램 사용할 때 일어나는 오류들 예상 가능한 예외 사전에 인지 가능 예상 불가능한 예외 인터프리터 과정에서 발생하는 예외 예외 처리(Exception Handling) try~except 문법 if문으로 대체 가능 else 구문 생략 가능 try: 예외 발생 가능 코드 except : 예외 발생시 대응 코드 #생략 가능 else: 에외 발생하지 않을 때 코드 #생략 가능 finally: 무조건 실행하는 코드 #예외 발생시 멈추지 않고 이어서 돌아간다는 장점 **raise 구문** 강제적으로 Exception 발셍 **assert 구문** 조건을 만족하지 않았을 경우 예외 발생 **File H..

정리/부캠-1 2023.03.12

[부스트캠프 AI Tech] Day 2

3)파이썬 기초문법 2 3-1) Python Data Structure 파이썬 기본 데이터 구조 스택과 큐(stack & queue with list) 튜플과 집합(tuple & set) 사전(dictionary) Collection모듈 스택 나중에 넣은 데이터를 먼저 반환(LIFO) 입력을 Push, 출력을 Pop이라고 함 큐 먼저 넣은 데이터를 먼저 반환(FIFO) Stack과 반대 튜플 값의 변경이 불가능한 리스트 리스트의 연산, 인덱싱, 슬라이싱 등을 동일하게 사용 프로그램 작동 동안 변경되지 않는 데이터의 저장 Set 값을 순서없이 저장, 중복 불허 Dictionary 데이터 저장 시 구분지을 값과 함께 저장 구분을 위한 데이터 고유 값을 Identifier 도는 Key라고 함 Key 값을 활용..

정리/부캠-1 2023.03.12

[부스트캠프 AI Tech] Day 1

1) 파이썬 AI 개발환경 준비 1-1) Basic computer class for newbies 컴퓨팅OS 컴퓨터를 동작하기 위한 기반 프로그램은 기본적으로 Windows용 / Mac OS용 등 나누어져 있기 때문에 운영체제에 맞춰 다운로드해야 함 *Python의 경우 운영체제에 독립적이기 때문에 별도 설치 x File System os에서 파일을 저장하는 트리구조 저장체계 파일의 기본체계 디렉토리 : 폴더 파일 : 컴퓨터에서 정보를 저장하는 논리적인 단위(파일명.확장자) 터미널 마우스가 아닌 키보드로 명령을 입력하는 환경 Command Line Interface(CLI환경) Windows - CMD window, Windows Terminal Mac, Linux - Terminal Console =..

정리/부캠-1 2023.03.12

[다변량 데이터 분석] Chapter.01 Introduction

본 게시글은 강필성 교수님의 다변량 데이터 분석 강의를 기반으로 작성되었습니다. 작성자 : KUBIG 16기 최규빈 Chapter 1) Introduction to Multivariate Introduction to Data Science Data-driven Decision Making 데이터를 기반으로, 객관적인 수치를 토대로 최적의 의사결정 What we want to know word description Optimization 실행할 수 있는 최적이 무엇인가? Predictive modeling 다음에는 무슨 일이 발생할 것인가? Forecasting 현재의 트랜드가 계속될 것인가? Statistical Analysis 왜 이번 일이 발생한 것인가? Alerts 이 상황에 필요한 액션이 무엇인가..

[NLP]IMDB 영화리뷰 감정분석

캐글 Bag of Words Meets Bags of Popcorn대회 리뷰가 긍정인 경우 **1**을 부정인 경우 **0** [Reference] 캐글 경진대회 : https://www.kaggle.com/c/word2vec-nlp-tutorial 인프런 강의 : https://www.inflearn.com/course/nlp-imdb-%ED%8C%8C%EC%9D%B4%EC%8D%AC-%EC%9E%90%EC%97%B0%EC%96%B4-%EC%B2%98%EB%A6%AC/dashboard 코드는 Colab에서 작성되었습니다. # 내 드라이브에 바로가기를 만들어서 공유문서를 연결할 수 있다 from google.colab import drive drive.mount('/gdrive', force_remoun..

정리/NLP 세션 2023.01.24

[Pytorch 기본] Classifier

해당 게시글은 개인적인 복습을 위해 PyTorch tutorial을 기반으로 설명을 덧붙이고 코드를 수정하며 정리한 글입니다. Training a classifier about data 데이터를 다룰 때 유용한 packages Image data : Pillow, OpenCV Audio data : scipy, librosa Text data : NLTK, SpaCy 사용한 데이터 : CIFAR-10은 10개의 classes ('airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck')로 이루어진 3 x 32 x 32 size의 image data이다. (3-channel color images of 32..

정리/Pytorch 2023.01.21