네이버 부스트캠프(naver boostcamp) 9

[부스트캠프 AI Tech 프리코스] 12강 선형결합

벡터와 스칼라(가중치)의 곱으로 이루어진 덧셈 연산을 선형결합(벡터 방정식)이라고 한다 벡터 방정식을 이용해서 해가 있는지 따져볼 수 있다 span : 재료 벡터를 가지고 만들 수 있는 모든 선형결합(벡터)의 집합 두 벡터가 선형결합을 통해 만들어내는 평면(무수히 많은 벡터들)을 span이라고 한다 만약 1개의 벡터를 고려한다면 '선'이 되는 것이고 2개의 벡터라면 '면' , 3개라면 '공간'이 되는 것이다 이 선,면,공간 모두 span이라고 부른다 (물론 4,5,6개... 도 가능하겠지?) 3개의 재료벡터와 미지수 x(가중치)의 선형결합으로 가능한 모든 경우(span)을 만들어 봤을때 그 span에 우항의 벡터가 포함되어 있다면 해(x1,x2,x3)가 있는 것이고 그렇지 않다면 해가 없는 것이다 재료 ..

[부스트캠프 AI Tech 프리코스] 11강 선형방정식과 선형시스템

위와 같이 정리해두고 x를 어떻게 구할지 생각하는게 관건 정사각형의 배열이고 대각 요소가 전부 1인 행렬을 의미한다 좌측이든 우측이든 곱했을때 identity matrix가 나오게 하는 A-1을 역행렬이라고 한다 역행렬의 유무는 det를 계산해서 알 수 있다 역행렬이 존재하면 해가 유니크하고 역행렬이 존재하지 않으면 해가 없거나, 무수히 많다 역행렬을 이용해서 x의 값을 구할 수 있다 방정식보다 변수가 많으면 해가 무수히 많고 (under-determined system) 변수보다 방정식이 많으면 해가 존재하지 않는다 (over-determined system) under : 근사적으로 접근하는 값을 구하는 방법이 따로 있다 over: 가장 적합한 (가중치가 적은, 리스크가 적은) 값을 구하는 방법이 있..

[부스트캠프 AI Tech 프리코스] 10강 경사하강법(순한맛)

이제는 컴퓨터가 미분 대신해준다 (야호!) 지금은 2차원이라 그림만 보고도 어디 방향으로 가야 증가하는지 알 수 있지만 이걸 1억 차원이라고 생각하면 미분을 통하지 않고서는 알 수 가 없다 미분값(음수,양수의 관계없이)을 더 해주면 f(x)가 증가하고 빼주면 f(x)가 감소한다 이 방법을 이용해서 극대값을 찾는 것을 경사상승법, 극소값을 찾는 것을 경사하강법이라고 한다! (고등학생때 이 교수님 수업을 들었다면 성적이 더 좋았을텐데...) 위의 예시에서는 가장 단순한 예시였고 만약 변수가 벡터 즉 변수가 x,y,z,... 여러개라면 어떻게 해야하나 이때는 편미분을 이용하는데 벡터에서는 이를 단위벡터를 사용해서 원하는 방향만 남기는 방식으로 처리한다 x에 대해 편미분하면 x방향에 대해 알 수 있고, y에 대..

[부스트캠프 AI Tech 프리코스] 9강 행렬이 뭐에요?

내적은 xy와 yx가 값이 다르기 때문에 순서가 중요하다 원래 수학적 내적은 x의 행벡터와 y의 열벡터의 곱을 의미하는데 넘파이에서의 행렬(inner)은 x와 y의 전치행렬 사이의 내적을 의미하기 때문에 주의해야함 np.inner에서의 계산방식 행렬은 두 점을 이어주는 함수라고도 생각할 수 있음 (여기서는 A가 행렬) 행과 열의 갯수가 같아야(NXN) 역행렬 가능 determinant 는 0이 아니여야함 역행렬의 조건이 까다롭기 때문에 다른 방법을 고안한것이 바로 유사역행렬이다 A+라는 기호를 사용하고 n,m의 크기 비교에 따라 사용법이 달라진다 연립방정식을 행렬을 통해 풀 수 있는데 만약 n < m 상황 (식보다 변수가 많은 상황) 이라면 해가 무수히 많다, 구할 수 없다가 보통의 수학인데 여기서 유사..

[부스트캠프 AI Tech 프리코스] 8강 벡터가 뭔가요?

단순한 한 점이 아니라 방향성을 가지고 있는 점(좌표),혹은 그 방향 자체(크기)라고 봐도 될듯하다 위에서는 3차원까지만 예시를 했지만 이를 n차원까지 늘리면 n개의 원소를 요소로 가지는 리스트 또는 배열로 생각해볼 수 있다 같은 모양의 벡터끼리는 +- 그리고 성분곱(*)이 가능함 두 벡터의 경로를 이어 시작과 끝을 잇는 벡터가 두 벡터의 합이다 벡터의 차원에 상관없이 계산이 가능하다 여러가지 노름 방법이 있다 L1 노름은 각 성분의 절대값 크기를 모두 더한 것이다, 즉 요소의 경로를 하나하나 따라가며 크기를 잰것 L2노름은 피타고라스 정리를 이용해서 계산을 통해 거리를 구하는 느낌이다 기계학습의 목적에 따라 다른 노름이 사용된다 두 벡터 사이의 거리를 구할때는 뺄셈을 이용한다 두 벡터의 각도를 구할때는..

[부스트캠프 AI Tech 프리코스] 7강 numpy

numpy 리스트는 데이터형이 같아야함 numpy 리스트와 python 리스트의 차이점 numpy리스트는 바로 숫자가 들어가고 python 리스트는 메모리가 할당되고 한번 더 타고 들어가서 값이 나오는 구조 이 때문에 numpy는 계산이 빠르고 python은 변동이 자유로움 또한 같은 데이터형을 넣기 때문에 메모리 크기가 일정하게 관리할 수 있음 파이썬에서는 -5 ~ 256까지는 메모리에 미리 할당되어 있기 때문에 위와 같은 일이 일어남 numpy는 새로운 공간에 순차적으로 할당하기 때문에 위와 같은 결과가 나옴 rank는 차원을 의미 스칼라는 0차원, 벡터는 1차원, 3차원부터는 텐서라고 함 ndim은 차원 즉 rank를 의미 size는 데이터의 갯수 여기서는 48개가 됨 shape의 표기는 (열) =..

[부스트캠프 AI Tech 프리코스 6강] File / Exception / Log Handling

예외처리(exception handling) ZeroDivisionError 와 같은 빌트인 에러로 잡고 처리하지 못한 나머지 에러는 Exception으로 잡는다 물론 모든 에러를 Exception으로 잡을 수 있는데 어디서 에러가 발생했는지 바로 확인할 수 없기 때문에 좋은 코드가 아니다 raise를 사용해서 에러를 발생 시킬 수 있다 File Handling Binary 파일 해당 파일을 열기위한 프로그램이 따로 있는 경우 Text파일 인간이 알아 볼 수 있는 형태로 되어있어 메모장 프로그램으로 열 수 있는 경우 with 구문으로 쓰면 close()를 안써도 됨 shutill (파일을 옮길때 사용) join을 쓰는 이유 윈도우는 '\\'으로 위치를 지정하지만 맥에서는 다르기 때문에 join으로 경로를..

[부스트캠프 AI Tech 프리코스 5강] Module and Project

모듈 모듈은 레고 블록이라고 생가하면 됨 패키지는 이런 레고블록들을 잘 정리해서 모아둔 박스 파이썬에서는 패키지가 많고 잘 돼있어서 블록 조립하듯 뽑아서 만들면 됨 __name__ == '__main__' 이 없다면 위의 모듈을 import할때 자동으로 print가 실행됨 이를 방지하고자 __name__ 사용 모듈의 호출방법 3가지 가장 위에 있는 'import 모듈명'으로 사용하는게 좋음 코드를 직관적으로(코드가 어디서 왔는지) 볼 수 있기 때문 패키지의 정의 폴더별로 __init__을 설정하여 패키지(모듈 모음집)라는 것을 알리는 것, 파이썬 3.3버전부터는 필요없지만 그래도 해주는게 관례 가상환경 필요한 패키지를 이것저것 다 설치하다보면 언젠가 충돌이 일어날 수 있고, 비효율적임 둘중해서는 cond..

[부스트캠프 AI Tech 프리코스 4강] Python Object Oriented Programming

OOP (Object-Oriented Programming) 객체지향 프로그래밍 객체(속성과 행동을 가짐) 개념을 프로그램(속성은 변수, 행동은 함수)으로 표현하는 것 파이썬은 객체 지향 프로그램 언어 클래스는 설계도(붕어빵틀), 실제 구현체는 인스턴스(붕어빵) 클래스의 선언 파이썬에서 클래스는 위와 같이 선언한다 () 괄호안 object는 안 넣어도 자동 상속된다 파이썬에서 클래스는 CamelCase로 작성한다 def __init__ 은 클래스의 속성과 초기 설정을 담당한다 self는 클래스로 만들어질 인스턴스(클래스로 만드는 새로운 변수)를 의미한다 클래스속 함수는 메소드라고 부르며 인스턴스.메소드명() 으로 사용한다 파이썬 클래스에는 __[ ]__ 모양을 하고 있는 특수한 함수들이 여러개 존재하는데..