본문 바로가기

머신러닝2

[NLP] 자연어 처리를 위한 필수 개념 정리: Language model, Representation 2018-01-20-nlp-1 Language Model(언어 모델)[정의] 단어 시퀀스에 대한 확률 분포로, 시퀀스1 내 단어 토큰들에 대한 확률을 할당하는 모델이다. m개의 단어가 주어질 때, m개의 단어 시퀀스가 나타날 확률은 다음과 같다.예를 들어, 시퀀스 내 단어들이 "Today is monday" 라는 문장을 이루게 되는 확률을 구해보자. "Today" 가 선택될 확률은 P("Today")다. 그 다음 "is" 가 올 확률은 P("Today")·P("is") 라고 생각할 수 있다. 하지만 글은 순서가 동일해야 똑같은 의미를 지니는 시퀀스 데이터다. 따라서 다음과 같이 표현되어야 한다.이러한 확률 분포는 학습 데이터의 성격에 따라 매번 다르게 계산될 것이다. 왜냐하면 학습 데이터의 성격이 다르면.. 2019. 1. 21.
딥러닝, 머신러닝, 패턴인식 뭐가 다를까? 2018-07-04-artificial-intelligence 1. 인공지능(AI, Artificial Intelligence)궁극적으로 흉내 내고자 하는 목표를 의미하는 포괄적인 용어이다.기계로부터 만들어진 지능이며, 컴퓨터 공학에서 이상적인 지능을 갖춘 존재, 즉 인공적인 지능을 뜻한다.철학적 관점에서는 강인공지능과 약인공지능으로 나뉜다.강인공지능(Strong AI, 범용 인공지능, AGI) 어떤 문제를 실제로 사고하고 해결할 수 있는 컴퓨터 기반의 인공적인 지능을 만들어 내는 것에 관한 연구인간의 사고와 같이 컴퓨터 프로그램이 행동하고 사고하는 인간형 인공지능.인간과 다른 형태의 지각과 사고 추론을 발전시키는 컴퓨터 프로그램인 비인간형 인공지능.약인공지능(Weak AI) 어떤 문제를 실제로 사고하거.. 2018. 12. 26.