파이썬을 이용한 머신러닝, 딥러닝 실전 개발 입문 도서를 스터디하여 정리한 내용입니다.코드는 http://wikibook.co.kr/python-machine-learning/ 에서 다운 가능합니다. [이미지와 딥러닝 - 라멘 메뉴 이미지 판별하기]책의 예제는 규동 메뉴로 가지고 했지만, 나는 라멘 메뉴를 선택하여 실습해보았다.스크레이핑으로 이미지 수집하기데이터를 전처리/가공하기머신러닝으로 분석하기 CNN 알고리즘 사용목표 : 라멘 사진을 던져주면 무슨 규라멘인지 알려주고 칼로리도 예측해보장 1.스크레이핑부터 시작하기플리커, 인스타그램과 같은 이미지 공유 사이트에서 수집할 수 있으나 가입을 해야함...가입하고 token얻고 귀찬포도주(Photozou)라는 사이트는 가입 없이 사용 가능포도주 검색 API를..
파이썬을 이용한 머신러닝, 딥러닝 실전 개발 입문 도서를 스터디하여 정리한 내용입니다.코드는 http://wikibook.co.kr/python-machine-learning/ 에서 다운 가능합니다.[이미지와 딥러닝 - CNN으로 이미지 분류하기]CNN(합성곱 신경망) 사용색상이 있는 이미지 분류하기TensorFlow + Keras 사용 1. 이미지 데이터를 파이썬 데이터로 변환하기먼저, Caltech 101 이미지 데이터 세트를 처리해서 image/5obj.npy라는 파일로 저장!src/ch7/caltech101_makedata.py 실행 1) 이미지 세트가 들어있는 폴더 이름, 분류 대상 카데고리를 지정한다.2) 이미지 크기를 지정한다. 색상 데이터를 나타내기 위해 각 픽셀마다 RGB값을 나타내는 3..
파이썬을 이용한 머신러닝, 딥러닝 실전 개발 입문 도서를 스터디하여 정리한 내용입니다.코드는 http://wikibook.co.kr/python-machine-learning/ 에서 다운 가능합니다. [이미지와 딥러닝 - 유사 이미지 검출하기]Average Hash 알고리즘 사용PIL(Pillow) 라이브러리 Average Hash이미지를 비교 가능한 해시 값으로 나타낸 것이미지가 조금 다르더라도(이미지 해상도 크기, 색조, JPEG/PNG 등의 압축 형식 등) 유사한지를 검출해야 할 때 사용. 구체적인 방법1) 이미지 크기를 8 x 8(또는 16 x 16)로 축소한다.2) 색을 그레이스케일로 변환한다.3) 이미지의 각 픽셀의 평균을 계산한다.4) 각 픽셀의 어두운 정도가 평균보다 크면 1, 평균보다 작..
Linear Regression의 cost 최소화 알고리즘의 원리 강의 슬라이드 : http://hunkim.github.io/ml/lec3.pdf - Simplified hypothesis . H(x) = Wx - cost(W)는 무엇일까? . 밥그릇 엎어놓은 모양인 그래프 . 목표 : cost가 작아지는 W와 b를 찾는것 . 사용되는 알고리즘 : Gradient descent algorithm (경사를 따라 내려가는 알고리즘) - 어떻게 작동할까? . 각 지점마다 경사도 체크 . 항상 최저점에 도달할 수 있다. . 경사도 구하는 방법은 미분! - Convex function : 모양이 convex이기 대문에 항상 답을 찾을 수 있다. (cost의 최소값)
Lenear Regression의 Hypothesis와 Cost - (Linear) Hypothesis . 어떤 리니어한 모델이 우리가 가지고 있는 데이터에 맞을거다 라고 가설 (비례) . 공부 많이 한 학생이 성적이 높을거라든지 등.. . 리니어한 선을 찾는 것. 학습하는 것 . 수학적으로 나타낸다면 ? H(x) = Wx + b ( H : 가설 ) , W와 b의 값에 따라 선이 결정 . 어떤 선이 잘 맞는 그래프의 선일까? 실제 데이터와 가설이 나타내는 점들과의 거리를 비교해서 거리가 멀면 나쁜것, 가까우면 좋은것. . Cost function or Loss function (거리 측정) : H((x) - y)^2 , 거리의 차를 제곱 . cost(W,b) 는 값이 가장 작게 나오는 것을 학습시키는 것..
Skin by WaaNee | Copyright © 2017 by SBeen. All Rights Reserved.