혼공학습단 9기 활동의 마무리! 한 주도 빼먹지 않고 완주했다는 점이 뿌듯하다 ㅎㅎ 마지막까지 파이팅!~! 혼공머신 (머신러닝 + 딥러닝) 6주차 미션 기본미션 : chapter 07-1 확인문제 풀고 풀이과정 정리 1. 어떤 인공 신경망의 입력 특성이 100개이고 밀집층에 있는 뉴런 개수가 10개일 때 필요한 모델 파라미터의 개수는 몇 개인가요? 답 : 1010 입력 특성 * 뉴런 개수 + 절편 = 100 * 10 + 10 = 1010 2. 케라스의 Dense 클래스를 사용해 신경망의 출력층을 만들려고 합니다. 이 신경망이 이진분류 모델이라면 activation 매개변수에 어떤 활성화 함수를 지정해야 하나요? 답 : sigmoid Dense 클래스에서는 뉴런 개수, 뉴런의 출력에 적용할 함수, 입력의 ..
혼공머신( 머신러닝 + 딥러닝 ) 5주차 미션 기본미션 : k-평균 알고리즘 작동 방식 설명하기 오늘은 비지도 학습의 방식 중 하나인 k평균 알고리즘을 실습해보겠다 k평균 알고리즘은 기본적으로 3가지 단계로 움직인다 1. 무작위로 k개의 클러스터 중심을 정한다2. 각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터의 샘플로 지정한다3. 클러스터에 속한 샘플의 평균값으로 클러스터 중심을 변경한다 클러스터 중심에 변화가 없을 때까지 2번으로 돌아가 반복하는 것이 이 알고리즘의 작동 방식이다이러한 단계들을 그림으로 나타내면 다음과 같다 1번 그림에서처럼 클러스터 중심(파란 점)을 랜덤하게 지정한 뒤 클러스터 중심에서 가장 가까운 샘플을 클러스터로 묶는다 그리고 클러스터의 중심을 조금 이동시킨다 이동시..
혼공머신 (머신러닝+딥러닝) 4주차 미션 기본 미션 : 교차 검증을 그림으로 설명하기 테스트 세트를 사용하지 않고 모델의 과대적합 과소적합 여부를 판단하기 위한 방법이 검증 세트를 만드는 것이다 훈련 세트를 검증 세트로 또 나누는 것이다 주로 20%-30%를 테스트 세트와 검증 세트로 나눈다 훈련 데이터가 많을수록 모델이 좋아지기 때문에 테스트 세트와 검증 세트를 만드느라 훈련 세트가 너무 감소하면 안된다 그렇다고 훈련 데이터를 늘리기 위해 검증 세트를 너무 조금만 나누면 검증 점수가 불안정해진다 교차 검증을 통해 이를 해결할 수 있다 교차 검증은 검증 세트를 떼어 내어 평가하는 과정을 여러 번 반복하는 것으로, 안정적인 검증 점수를 얻고 훈련에 더 많은 데이터를 활용하기 위한 방법이다 아래 그림은 3-..
혼공머신 (머신러닝+딥러닝) 3주차 미션 기본미션 : chapter 4-1의 2번 문제 풀고 과정 설명 이번 챕터에서는 로지스틱 회귀를 다룬다 로지스틱 회귀(logistic regression)은 회귀이지만 분류 모델로, 선형 회귀와 동일하게 선형 방정식을 학습한다 선형 회귀는 하나의 특성을 사용한 선형 회귀, 다중 회귀는 여러 개의 특징을 사용한 선형 회귀이다 선형 방정식에서의 z값은 범위가 정해져 있지 않지만, 확률이 되려면 0과 1 사이의 값이 되어야 한다 이때 이진 분류에서는 시그모이드 함수(로지스틱 함수)를 사용하여 아주 큰 음수는 0으로, 아주 큰 양수는 1로 바꿔준다 문과이기 때문에 정확히 수식을 설명하기는 어렵지만... 자연상수 e를 거듭제곱하고 1을 더한 값의 역수를 취하는 함수라고 한다..
혼공머신 (머신러닝+딥러닝) 2주차 미션 미션은 3-1 연습문제이지만 3-1 내용을 복습 겸 정리해보겠다 오늘은 새로운 데이터인 농어 데이터를 사용한다 넘파이 불러와주고 농어 길이랑 무게 데이터를 가져와준다 데이터 불러왔으면 해야 하는 것은? matplotlib 가져와주고 산점도 그래프 그리기 사이킷런의 train_test_split 함수를 통해 훈련 세트와 테스트 세트를 나눠준다 perch_length와 perch_weight, 총 2개의 배열을 넣었기 때문에 각 2개씩 나뉘어 총 4개의 배열이 반환된다 random_state는 랜덤시드인데 42로 지정했다 reshape() 메서드를 통해 train_input과 test_input을 2차원 배열로 바꿔준다 사이킷런은 2차원 배열로 데이터가 들어오길 기대..
혼공머신 (머신러닝+딥러닝) 1주차 미션 구글 코랩은 웹 브라우저 기반 파이썬 코드 실행 환경이다 별도의 환경 구축 없이 크롬과 같은 웹 브라우저로 간편하게 코드를 실행할 수 있다는 장점이 있다 (코드 실행 가능 + 데이터 사이언스 분야에서 주로 쓰이는 여러 라이브러리 제공) 작성된 코드들을 구글 드라이브에 바로 저장할 수 있다 머신러닝 = 머신러닝 프로그램을 만든다! 전통적인 프로그램 -> 누군가가 규칙을 정해서 프로그램을 작성 머신러닝 프로그램 -> 프로그램이 데이터를 바탕으로 스스로 규칙을 찾도록 하는 프로그램 matplotlib는 파이썬에서 그래프를 그릴 때 사용하는 대표적인 라이브러리이다 as 이후에 오는 것은 약어인데, pyplot은 plt라고 설정하는 것이 국룰이다 import를 통해 mat..
3학년 되기 전 마지막 방학을 알차게 보내기 위해 혼공학습단 9기에 머신러닝+딥러닝 책으로 참여하게 되었다! 학교 강의를 통해 머신러닝을 배워보고 싶었는데 전공으로 인정이 안되어서... 복전을 해야 하는 나는 전공 아닌 과목을 듣기엔 시간이 빠듯하므로 아쉽게도 포기하게 되었다 대신 방학동안 혼자 열심히 공부해보고자 신청했다! 학교 강의를 통해 접해본 R을 더 열심히 해볼지 한번도 다뤄본 적 없는 SQL을 배워볼지 파이썬 활용하는 데이터분석을 더 파고들어 볼지 고민했지만 제대로 배워보고 싶었던 머신러닝으로 선택하게 되었다 커리큘럼대로 뒤쳐지지 않고 열심히 해봐야지 !!