티스토리 뷰
데이터 사이언스는 특정 도메인의 깊은 지식과 수학, 전산, 소프트웨어 개발 등 다양한 분야의 전문적인 지식이 필요한 부분이다. 그런만큼 모든 것을 한다는 것은 사실상 불가능하다고 볼 수 있다.
이런 상황에서 본인이 어떤 역할자로 데이터 사이언스 분야에 활동할 것인지를 잘 판단하는 것이 중요하다.
학습
데이터 사이언스를 분야를 알기 위해서 필요한 것을 나열해 보면
-
데이터 처리를 위한 프로그래밍 언어에 대한 이해
-
Machine Learning, Neural Networ, Deep Learning에 대한 개념 이해
-
ML관련 기초 수학 지식
-
데이터 분석 모델링을 위한 플랫폼의 이해(PyTorch, Keras, Tensorflow, ...)
-
대표 모델들에 대한 이해(AlexNet, Vgg, ResNet, ...)
-
응용되어지는 분야에 대한 도메인 지식
-
구축한 모델의 활용을 위한 인프라 아키텍처의 이해
-
구축한 모델을 서비스하기 위한 어플리케이션의 개발 및 운영 방법 이해
-
데이터 추출에서 분석까지의 전산적인 흐름의 이해 (ETL)
-
고급수학
-
...
정말 많다.
데이터 사이언스 분야를 시작하는 시점에서 벽이 높다는 점을 실감하지만
현재 우선적으로 해야 하는 것은
데이터 처리를 위한 대표적인 라이브러리를 손에 익히는 것(NumPy, Pandas)과 ML분야에 대한 기본적인 개념을 가지는 것이라 생각한다.
데이터 분석 - Python
파이썬의 경우 집중도를 가지면 쉽게 익힐 수 있는 언어라고들 한다.
하지만 numpy, pandas의 경우 강력하지만 원리를 이해하는 것은 쉽지만은 않다.상당히 어려운 부분이다. 지속적으로 계속 써야 손이 기억한다는 점이 중요하다.
파이썬 기초
-
Python Tutor: 코드의 흐름을 시각화해서 보여줌.
파이썬 Pandas, Numpy 관련 좋은 문서들
- 개인적으로 추천하는 블로그는 https://rfriend.tistory.com
테스트
인공지능 강좌
....
.....
AI 종합 강좌
-
Coursera
-
Andrew Ng's ML class: https://www.coursera.org/learn/machine-learning
-
모두를 위한 머신러닝/딥러닝 강의(홍콩과기대 김성훈)
CNN
GAN
TensorFlow, Keras
[
케라스 강좌 내용
케라스로 배워보는 딥러닝 강좌를 아래 내용를 아래 순서대로 진행하고자 합니다. 1권 (블록과 함께하는) 파이썬 딥러닝 “케라스” 기초 케라스 시작하기 딥러닝 개념잡기 레이어 개념잡기 레시피 따라해보기 부록 2권 (블록과 함께하는) 파이션 딥러닝 “케라스” 활용 [시계열영상입력 이진분류 모델 레시피] [시계열영상입력 다중클래스분류 모델 레시피] [특징맵 살펴보기] [시퀀스 출력을 가지는 모델 구성] 객체 검출(object detection) 해보기 영상 분
tykimos.github.io
](https://tykimos.github.io/lecture/)
교재 Mindmap
현재 시간적 여유가 되어서 교재 및 인터넷 강의를 통해 학습을 진행하고 있는데
데이터 분석의 경우 "파이썬 라이브러리를 활용한 데이터 분석"과 "밑바닥부터 시작하는 딥러닝"을 보고 있다.
전자의 경우 비추 후자의 경우 강추
파이썬 라이브러리 책의 경우 책 구성이 복잡하게 되어 있어 이해하는데 방해가 됨. 약간 중구난방
밑바닥 책의 경우 개념이해에 많은 도움이 되고 있음.
또한 밑바닥의 옮긴이인 개앞맵시의 마인드 맵을 통해 향후 학습 방향에 대해 쉽게 생각할 수 있음
https://www.mindmeister.com/ko/812276967/_
정리해야 할 내용들
-
ML01. 학습 및 참고 사이트
-
ML02. AI, Machine Learning, Deep Learning Overview
-
ML03. 데이터 분석
-
ML04. Tensorflow, Keras, Eager
-
ML05. Machine Learning
-
ML06. Deep Learning
-
ML07. CNN
-
ML08. RNN
-
ML09. Project
ㅁㅁㅁㅁㅁ
가나다라마바사
테스트2
ㅁㅁㅁ
'공부하자 > 머신러닝' 카테고리의 다른 글
머신런닝 공부를 하면서 느낀 점 (0) | 2019.03.22 |
---|---|
ML02. AI, Machine Learning, Deep Learning Overview (0) | 2019.03.18 |
ML03. 데이터 분석 (0) | 2018.04.25 |
Analytics 유형, Types of Data Analytics (0) | 2017.09.11 |
#4. Linear Regression (0) | 2017.09.01 |
- Total
- Today
- Yesterday
- Bioinformatics
- illumina
- deep learning
- wget
- 우드스토브
- GaN
- CNV
- 생물정보기업
- VirtualHost
- pygr
- TM
- tensorflow
- machine learning
- MySQL
- 화목난로
- Python
- Mate pair
- Next Generation Sequencing
- 가상호스트
- xbrowser
- transmembrane
- ssh
- edwith
- signalP
- 리눅스
- paired-end
- 달인
- color scripter
- Aging
- 리눅스 모니터링
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |