전체 글 (177) 썸네일형 리스트형 3강 - 삽입 정렬 (Insertion Sort) 1. 삽입 정렬 (오름차순을 기준) 1) 정의 뒤의 숫자가 정렬되어있다고 가정하고 한 칸씩 이동하며 해당 index의 element을 뒤의 정렬된 숫자 사이 중 올바른 자리에 넣어준다. 2) 특징 1> 시행은 1번째 element부터 시작한다. (0번째는 정렬 되어있다고 가정) 2. 구체적인 과정 1> 0번째 element는 정렬 되어있다고 가정하고 1번째 element를 적절한 위치에 넣는다. 2> 적절한 위치는 처음으로 자신보다 작은 수가 나오는 부분이다. (없다면 맨 앞에 들어가게 한다.) 3> 1>~2>를 맨 마지막 N-1번째 element까지 진행한다. 3. 구현 (오름차순을 기준) 0) 주요 point 1> 어떻게 중간에 삽입하는가? - 현재 위치를 찾는 element를 계속해서 swap을 통.. 2강 - 버블 정렬 (Bubble Sort) 1. 버블 정렬 (오름차순을 기준) 1) 정의 앞에서부터 서로 인접한 두 원소를 검사하여 정렬(바로 그 뒤로 보낸다.) 2) 특징 1> 방향 - 선택 정렬: (0~N-1) -> (1~N-1) -> (2~N-1) -> ... -> (N-1) - 버블 정렬: (0~N-1) -> (0~N-2) -> (0~N-3) -> ... -> (0~1) (둘 다 정렬에서 제외되는 data가 하나씩 늘어간다.) 2. 구체적인 과정 (오름차순 기준) 1> 0번째 index부터 바로 1번째 index(오른쪽)와 비교해서 교체한다. (큰 data를 뒤로 보낸다.) 2> 1번째 index도 바로 옆이랑 위의 과정을 진행한다. ... N-2번째까지 진행한다. 3> 1> ~ 2> 를 (0~N-1) -> (0~N-2) -> (0~N-3.. 1강 - 선택 정렬 (Selection Sort) 1. 선택 정렬 1) 정의 첫 번째 자료를 두 번째 자료부터 마지막 자료까지 차례대로 비교하여 가장 작은 값을 찾아 첫 번째에 놓고, 두 번째 자료를 세 번째 자료부터 마지막 자료까지와 차례대로 비교하여 그 중 가장 작은 값을 찾아 두 번째 위치에 놓는 과정을 반복하며 정렬을 수행한다. 2) 특징 1> 제자리 정렬 (in-place sorting) -> 다른 추가 메모리를 요구하지 않음 2. 구체적인 과정 1> 주어진 array 전체(0~MAX)에서 가장 작은 원소를 찾는다. 2> '그 작은 원소'와 'array에서 0번째 원소'를 교체한다. 3> 1>~2>를 1번째 원소부터 마지막 원소까지의 범위에서 시행 4> 이를 하나의 원소만 남을 때까지 반복 3. 구현 1) 기본 구현 #include using .. Kaggle 1강 - EDA 1. data 전체 확인 1) 중복 data 1> df.duplicated(): 중복 여부를 True, False로 알려준다. 2> df[df.duplicated()]: 위를 boolean indexing을 통해 중복 data(row)를 따로 출력 3> df.drop_duplicates(): 중복 data가 제거된 DataFrame 2) 누락 data 1> df.info(): DataFrame에 대한 요약 정보(null, type)가 담겨 있으며 한 번에 null-data 파악 가능 2> df.isna: 누락 data에서 True를 반환 (== isnull() )) - df.notna: 누락 data에서 False를 반환 (== notnull() )) - df.isnull().sum(): 으로도 누락 d.. 후회하지 않는 법 후회를 하는 이유 사람들은 누구나 후회를 하며 산다. ‘아.. 어제 라면 먹지 말걸’, ‘아… 어제 좀 더 일찍 잘껄’ 와 같은 ‘Daily 후회’ 뿐만 아니라, ‘아… 그때 월급이 줄더라도 내가 좋아하는 일을 해볼껄‘, ’아… 대학생 때 교환학생 한번 가볼껄’ 와 같은 ‘인생에 지대한 영향을 미치는 후회’도 종종 하면서 말이다. ‘Daily 후회’는 수도승이 아닌 이상 어쩔 수 없다고 치더라도, ‘인생에 지대한 영향을 미치는 후회’를 하지 않는 방법은 없을까? 놀랍게도 우리가 알고 있는 성공한 창업가들도 똑같이 이에 대한 고민을 했고, 그 방법을 찾아냈다. 그 방법을 소개하기에 앞서, 우리가 ‘후회를 하는 이유’에 대해서 깊게 생각해보자. 우리는 왜 후회를 할까? 우리는 ‘과거의 내가 잘못된 선택을 했.. fdsf def x(*a): print(a) iterator (이터레이터)와 iterable (이터러블) 1. iterator 1) 기본 1> 정의: 값을 차례대로 꺼낼 수 있는 객체 2) 방식 1> 방식: iterator만 생성하고 값이 필요한 시점이 되었을 때 값을 만드는 방식 (미리 값을 만들어두고 가져다 쓰는 방식은 아니다.) 2> 그래서 data 생성을 뒤로 미룹니다. (lazy evaluation라고도 합니다.) 2. iterable (반복 가능한 객체) 1) 기본 1> 예시: string, 리스트, 딕셔너리, range, set, frozenset, - collection container는 모두 iterable - 대부분의 container는 다 iterable하다고 생각해도 됩니다. 2> 정의 1: 요소가 여러 개 들어있고, 한 번에 하나씩 꺼낼 수 있는 객체 3> 정의 2: iterable.. 2-2강 - 코퍼스 수집 0. data 수집 방법 1) 공개 data 사용 1> kaggle 2> 각종 대회 3> 논문을 위한 data 2) 구매 ※ 하지만 양이 한정적이거나 비용이 들 수 있습니다. 3) web crawling (웹 크롤링) 1> 특정 도메인에 편향되지 않게 최대한 다양한 도메인에서 corpus를 크롤링하는 게 좋습니다. 2> 하지만 무분별한 크롤링을 하면 법적인 문제에 휘말릴 수 있습니다. - 저작권 문제 - 불필요한 트래픽이 웹 서버에 가중되는 과정에서 문제 3> 해당 웹사이트의 크롤링 허용 여부는 해당 웹사이트의 최상단 주소에서 '/robots.txt'를 추가해서 접속하면 확인이 가능합니다. (이는 다른 분의 티스토리를 참고하기 바랍니다.: https://kugancity.tistory.com/entry/.. 이전 1 ··· 18 19 20 21 22 23 다음