Notice
Recent Posts
Recent Comments
Link
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
Tags
more
Archives
Today
Total
관리 메뉴

Altiora Petamus

[나만의 글쓰기] 4 주차 회의록 본문

SSAC X AIffel/회의록

[나만의 글쓰기] 4 주차 회의록

현석종 2021. 1. 29. 16:18

이번주 학습 내용

 

Fundamentals 

1. 파이썬 객체지향 프로그래밍 (OOP : Object Oriented Programming )

2. 탐색적 데이터 분석 (EDA : Exploratory Data Analysis )

3. 비지도학습 ( Unsupervised Learning)

 

Exploration

1. 이미지 데이터 Embedding - 닮은꼴 연예인 

2. 추천시스템(Recommender System) 구현 - Movielens 영화 추천 

 


Fundamentals

1.  파이썬 객체지향 프로그래밍 (OOP : Object Oriented Programming )

" Everything in Python is an object, and almost everything has attributes and methods.라는 말이 있을 정도로 파이썬을 다루는데 있어서 객체를 다르는 것은 중요하다.  이전에 학부에서 객체지향 프로그래밍 수업을 c++언어를 통해  배운적이 있기에 이론적인 부분에서 크게 어렵게 다가오진 않았지만 문법에 있어서 약간 다른 부분이 적응하는데 쉽지는 않았다. 더욱 능숙하게 다루려면 다양한 코드를 접해보면서 공부해야 할 것 같다. 

 

2.  탐색적 데이터 분석 (EDA : Exploratory Data Analysis )

EDA란 쉽게 말해서 데이터의 형태를 분석하는 것이다. 머신러닝에서 학습시키는 모델도 중요하지만 그 모델에 넣어줄 데이터 또한 매우 중요하다. 데이터를 학습시키기 전에 전처리를 하고 모델을 선택하여 학습을 시키는 등 모든 작업은 EDA를 얼마나 잘 수행하느냐에 따라 결과가 달라질 것이다. 사실 이 부분은 내가 노드들을 수행해오면서 집중적으로 신경쓰지 않았던 부분이다. 처음엔 pandas와 matplotlib의 문법이 익숙하지 않아 시간이 많이 걸렸다. 하지만 익숙해져야 할 부분이다. pandas와 matplotlib등 , EDA를 수행함에 있어서 유용한 method가 많아서 잘 다룰 수 있다면 유용할 것 같다. 

 

3. 비지도학습 ( Unsupervised Learning)

지금까지 노드들을 수행하면서 지도학습의 부분을 주로 다뤘었다. 이번 노드에서 아직은 나에게 익숙하지 않고 어려웠던 비지도 학습을 공부할 수 있었다. 지도학습을 하려면 먼저 준비된 데이터에 labeling작업이 이루어 져야 한다. 이 작업은 데이터의 양과 종류에 따라 큰 노동력이 따를 수 있다. (작년에 yolo darknet customing 하면서 사진 10000장을 labeling한 악몽이 있다.)

비지도 학습은 이러한 점에서 매우 편리한 것 같다. 

 


Exploration

1. 이미지 데이터 Embedding - 닮은꼴 연예인 

사실 노드를 끝까지 수행하긴 하였지만 임베딩이라는 것을 완전히 이해하진 못한 것 같다. "고차원 정보를 저차원으로 변환하면서 필요한 정보를 보존하는 것"이라고 머리속에 들어있긴 하지만 완전히 와닿진 않는다. 연예인 사진을 입력데이터로 하여 나의 사진과 닮은 연예인을 찾는다는 주제는 흥미로웠다. (잘생긴 연예인사진을 이용하였으니 당연히 잘생긴 연예인을 찾아준다.ㅋ)

임베딩은 이전 노드를 수행함에 있어서 여러번 접한적이 있는데 데이터를 벡터화 하여 저차원으로 변환한다는 발상 자체가 대단한것 같다.

 

2. 추천시스템(Recommender System) 구현 - Movielens 영화 추천 

일상생활에서 쉽게 접할 수 있는 분야로 추천시스템이 있는데, 평소엔 "이용자의 행동 패턴을 분석해서 학습하고 적용시키면 되겠지" 라고 쉽게 생각하던 것을 실제로 간단히 구현해보았다.  직접 구현을 하면서 느낀점은 신경써야 할 부분이 생각보다 많았다는 것이다. 데이터를 학습시키기 전에 용량에 대한 부분과 데이터에서 중요한 부분 그렇지 않은 부분을 고려하는 등 쉽지 않았다. 

일상 생활에서 쉽게 접할 수 있고 매우 유용한 system이므로 더욱 흥미로웠다. 

 


회고

이번주가 5주차라는데 나만 1주 밀린듯 하다(그래도 나는 걍 4주차라 할랭).  배우면 배울수록 매우 유용하고 좋은 정보들을 제공받는다는 생각이 든다. 이제 이것들을 모두 기록하고 내 머리속에 집어 넣는 일만 남았다. 가장 어렵고 시간이 많이 드는 일이다. 얼른얼른 분발해야 한다. 요즘들어 테블릿이 갖고싶다. 생각을 정리할 때나 필기할 때 등등 유용한 것 같다. (세상 사람들이 나에게 100원씩만 주면 살 수 있을텐데 )

Comments