인공지능/NLP

NLP 자연어처리 입문 가이드라인 (20.11.10)

구요구요 2020. 11. 8. 15:41

2019년 3월부터 NLP에 입문하여 공부중에 있습니다.

제 나름대로 공부해오면서 참고하면 좋았던 자료들을 정리합니다.

해당 포스팅은 지속적으로 업데이트 할 예정입니다. (현재 20.11.10)

댓글로 추천하시는 자료를 알려주시면, 자료를 읽어본 후 업데이트 하겠습니다.

감사합니다.

파이썬

점프투파이썬

파이썬에 대해 모르신다면 점프투파이썬을 통해 파이썬에 대해 공부하시는 것을 추천합니다.

링크: wikidocs.net/book/1

 

위키독스

온라인 책을 제작 공유하는 플랫폼 서비스

wikidocs.net

하지만 해당 문서를 공부하는 것 외에도 다른 자료들을 찾아보며 파이썬에 상당히 익숙해지셔야합니다.

인공지능

모두를 위한 딥러닝 강좌 시즌1

성킴 교수님의 모두를 위한 딥러닝 강좌 시즌1을 추천합니다.

링크: www.youtube.com/playlist?list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&app=desktop

 

모두를 위한 딥러닝 강좌 시즌 1

 

www.youtube.com

저는 프로그래밍에 대해 어느정도 익숙한 상태여서 작년 3월 해당 강좌를 통해 입문하였습니다.

딥러닝에 대한 기본적인 컨셉에 대해 이해할 수 있을거에요.

CS231n

이 후 Stanford Univ의 CS231n 수업을 들었습니다. (사실 듣다 말았습니다.)

링크: www.youtube.com/playlist?list=PLC1qU-LWwrF64f4QKQT-Vg5Wr4qEE1Zxk

 

Stanford University CS231n, Spring 2017

CS231n: Convolutional Neural Networks for Visual Recognition Spring 2017 http://cs231n.stanford.edu/

www.youtube.com

링크는 2017 Spring에 열린 CS231n 강의인데요, 아마 더 최신년도의 수업이 있을거에요.

저는 영어보다 한국어에 익숙해서 한국어 자막이 존재하는 2017 강의를 들었습니다.

한국어 자막은 github.com/visionNoob/CS231N_17_KOR_SUB 에서 받으실 수 있습니다.

구현

딥러닝 모델은 크게 TensorFlow, Pytorch 2가지 프레임워크를 사용합니다.

저는 구현시에 Pytorch를 씁니다. (하나만 할줄 알면 다른 쪽의 코드는 읽기 쉽습니다.)

저는 토치를 2가지 자료를 통해 입문했습니다.

파이토치 첫걸음

링크: www.hanbit.co.kr/store/books/look.php?p_code=B7818450418

 

파이토치 첫걸음

딥러닝 구현 복잡도가 증가함에 따라 ‘파이써닉’하고 사용이 편리한 파이토치가 주목받고 있다. 파이토치 코리아 운영진인 저자는 다년간 딥러닝을 공부하고 강의한 경험을 살려 딥러닝의

www.hanbit.co.kr

 

설치부터 CNN, RNN 등 여러 모델들이 어떻게 토치로 구현하는지와 더불어 각 모델에 대한 저자의 직관도 모델의 이해에 큰 도움이 되었습니다.

파이토치 튜토리얼

링크: tutorials.pytorch.kr/

파이토치 공식 홈페이지 튜토리얼입니다.

친절하기로 유명한 튜토리얼입니다. 필요로 하는 부분을 읽으시면 됩니다.

NLP

딥 러닝을 이용한 자연어 처리 입문

모두를 위한 딥러닝, CS231n(중간까지..ㅎ)를 듣고 딥러닝에 대한 감을 잡은 후에 NLP에 입문을 했습니다.

저는 위키 독스의 딥 러닝을 이용한 자연어 처리 입문 문서를 통해 입문했습니다.

링크: wikidocs.net/book/2155

 

위키독스

온라인 책을 제작 공유하는 플랫폼 서비스

wikidocs.net

해당 문서를 통해 NLP에 전체적인 그림을 배우고 큼직큼직한 task, model에 대해서 배웠습니다.

문서의 모든 것을 볼 필요는 없고, 궁금하거나 필요한 부분이 있을 때 마다 보시면 될 것 같습니다.

이정도까지 보시면 아마 본인이 관심있어하는 task도 생기고 해당 task 논문도 어느정도 읽어낼 정도가 될거라고 생각됩니다.

Jay Alammar's blog

링크: jalammar.github.io/

 

Jay Alammar – Visualizing machine learning one concept at a time.

Visualizing machine learning one concept at a time.

jalammar.github.io

NLP 논문들을 읽을 때 자주 등장하는 Transformer, BERT 등 여러 모델들을 쉽게 설명한 블로그입니다.

해당 논문을 읽기전에 블로그 포스팅을 읽고나서 논문을 본다면, 이해++++

ratsgo's blog

링크: ratsgo.github.io/

 

ratsgo's blog · for textmining

Original Artwork © Pablo Picasso. Girl before a Mirror. Boisgeloup, March 1932. Oil on canvas

ratsgo.github.io

석사과정 중 아주아주 도움을 많이 받은 블로그입니다.

인공지능, 선형대수, NLP, 텍스트 마이닝 등에 대한 폭넓은 topic을 다루며, 설명력이 기가막힙니다.

궁금한 topic이 생길때마다 항상 해당 블로그에 관련 포스팅이 있는지 확인하고, 있다면 최우선으로 읽어봅니다.