본문 바로가기

전체 글

(177)
2-1강 - 전처리 Intro 1. Corpus 1) 정의 1> '말뭉치' 2> 여러 단어들로 이루어진 문장 3> 즉, 우리가 이용할 data입니다. 2) 종류 1> monolingual corpus (단일 언어 코퍼스): 한 가지 언어로 구성된 코퍼스 2> bilingual corpus (이중 언어 코퍼스): 두 가지 언어로 구성된 코퍼스 3> multilingual corpus (다중 언어 코퍼스): 더 많은 수의 언어로 구성된 코퍼스 3) parallel corpus (병렬 코퍼스) 1> 정의: 2개 국어 이상의 번역된 문서를 모은 코퍼스 (언어 간에 쌍으로 구성되는 말뭉치) 2> 구조 - 문장 == 문장 - 문단 == 문단 3> 예시 영어 한글 I am the king. 나는 왕이다. This is an important ph..
1-3강 - 자연어 처리 최근 trend 1. 딥러닝이 접목된 현재까지의 흐름 0) 기존에는 n-gram 기반 언어 모델을 이용했습니다. 1) RNN 활용 1> 2010년부터 RNN을 활용해서 언어 모델을 시도했습니다. 2> 결국 기존 n-gram 방식과 RNN의 결합을 통해 더 나은 성능을 가져왔습니다. 3> 단점: speech recognition과 machine translation 분야에 쓰이기에는 연산량이 너무 많았습니다. 2) word2vec (토마스 미코로프, 2013, 구글) 1> 간단한 구조의 Neural Network를 사용해서 단어들을 latent space로 성공적으로 투사시킴 2> 이를 통해 고차원의 공간상의 단어가 어떻게 latent space에 배치되는지 알 수 있습니다. 3> 시각화 사이트: http://projec..
1-2강 - NLP와 한국어 NLP가 어려운 이유 1. NLP가 어려운 이유 0) discrete한 단어들로 이루어져 있다. 1) 모호성 1> 번역 시 존재하는 동음이의어 표현에 대한 대처가 어렵습니다. - 한영 번역 ('나는 차였어' 라는 유명한 말을 사용한 예시입니다. ㅎㅎ) 예시 차를 마시러 공원에 가던 차 안에서 나는 그녀에게 차였어 1 I was kicking her in the car that went to the park for tea 2 I got dumped by her on the way to the park for tea 3 I was in the car going to the park for tea and I was in her car 4 I was a car to her, in the car I had a car and went ..
1-1강 - NLP와 Deep Learning (자연어 처리와 딥러닝) 1. 자연어 처리란? 1) 기본 1> 정의: 사람의 언어를 컴퓨터가 알아듣도록 처리 2> 그래서 기본으로 수학적 지식(ML에 필요한 선형 대수, 통계)과 컴퓨터 공학적인 지식도 필요하고 언어학 지식까지도 필요합니다. 3> 최종 목표: 컴퓨터가 사람의 언어를 이해하고 여러 가지 문제를 수행할 수 있도록 하는 것 ​ 2) 응용 분야 1> sentiment analysis: 대량의 text를 이해하고 수치화하는 작업(분류부터 rating까지) 2> 대화를 통해 user의 의도를 파악하고 도움을 주는 작업 ex> 빅스비, 시리 등 3> summarization (요약) 4> machine translation (기계 번역) ​ 3) 그리고 이 작업들은 Deep Learning과 함께 비약적인 발전을 이뤘습니다...
3강 - 함수 (function) cf> 참고사항 1) printf는 문자열 같은 것들 출력 함수에 대한 기본 독립변수(input)과 종속변수(output)이 있고 꼭 output만 있는 게 아니고 side effect가 있다. 2. 전처리 명령어 -> 전역 변수 선언( 함수 선언) -> main 함수(local 선언, 함수 호출) ->함수 정의 => 함수 선언 -> 함수 호출 -> 함수 정의 3. 함수를 미리 선언하지 않고 main함수보다 앞에 있으면 error 함수 선언 형식 ( 출력형태 함수이름 (입력형태 변수이름) ) 1) 변수 이름은 생략해도 된다. 함수 정의 1. 형식 ( 출력형태 함수이름 (입력형태 변수이름) ) 1) 함수 정의 부분의 ‘입력형태 변수이름’이 formal-parametner list(형식 매개변수) 2) 함수..
2강 - structure of a C program expressions (표현식, 수식) 0. 특징 1) 값을 나타내려고 변수, 상수, 연산자로 구성된 식 2) 항상 결과(반환)값을 갖음 operator (연산자) -산술연산자(+,-,*,/,%) -관계연산자( ➁ a = a+1 (x에 a를 대입하고 a에 1을 더함) (선연산 후증가) 1) operand(피연산자)로 변수만 가능하다. (상수나 일반수식이 올 수 없다.) Unary expression(단항식): operator-operand (피연산자가 1개) -sizeof(int): data형의나 값의 크기를 바이트 수로 표시 -+a -++a -형변환 연산자 ex) (float) x Binary expression(이항식): operand-operator-operand Ternary expression(..
1강 - Introduction to C C programs 구조 1. 전처리 명령어: 컴파일 전에 소스코드를 처리 1) 예시 ex) #include #include(전처리 명령어): 어떤 파일을 포함한다. :1 stdio.h는 c언어 기본 라이브러리 2 확장자가 .h로 끝나는 헤더파일 3 printf함수 호출 정보 포함 #define~~: 상수나 매크로 함수 정리 ex) #define 2. global declaration 3. 함수 (지역변수 선언/ 명령문) 4. 기타 함수 token keyword ex) int, void (예약어) 1) 37가지 있다. identifier: 데이터나 객체에 부여하는 이름 ex) a, b sum (변수나 함수이름) 1) 첫 글자는 영문자나 _로 시작 2) 이후 구성은 영문자/숫자/_ 3) 처음 63글자만 구..
1406번 - 에디터 0. 링크 https://www.acmicpc.net/problem/1406 1406번: 에디터 문제 한 줄로 된 간단한 에디터를 구현하려고 한다. 이 편집기는 영어 소문자만을 기록할 수 있는 편집기로, 최대 600,000글자까지 입력할 수 있다. 이 편집기에는 '커서'라는 것이 있는데, 커서는 문장의 맨 앞(첫 번째 문자의 왼쪽), 문장의 맨 뒤(마지막 문자의 오른쪽), 또는 문장 중간 임의의 곳(모든 연속된 두 문자 사이)에 위치할 수 있다. 즉 길이가 L인 문자열이 현재 편집기에 입력되어 있으면, 커서가 위치할 수 있는 곳은 L+1가지 경우가 www.acmicpc.net 1. 조건 정리 1) 먼저 문자열을 입력 받는다. (영어 소문자만) (십만을 넘지 않는다.) 2) 커서는 글자 사이사이에 존재하며..