Tech
-
어설픈 인공지능 개발자(?)의 TTS 만들기Tech/머신러닝 2020. 4. 20. 09:40
텍스트만을 가지고 음성을 합성 해야 하는 일이 생겼다. 아직 인공지능 개발자라고 하기엔 남부끄러운 수준이고, 석사 박사들 처럼 전문가 스럽지 못하기 때문에 이 상황을 어떻게 해야할지 고민이 많아 졌다. Tacotron 2 tacotron 이라는 프로젝트가 있다. 간단하게 말하면 오디오 멜스펙토그램을 학습하여 유사한 음파를 합성하여 마치 말하는것과 같은 음성을 보여 주는것이다. 보통 tactron 관련된 블로그를 보면 아래 그림같은것들과 함께 네트워크 모델에 대한 설명들을 기본적으로 하고 있다. 하지만 , 난 솔직히 말하면 음성쪽 전문가가 될 생각도 없고 딱 필요한 부분까지만 사용할 예정이다. 그리고 아직 이 내용들을 이해할 노하우나 지식이 없다. 나중에 좀더 공부를 해야 하겠지만 그건 나중일 인거 같다...
-
[딥러닝] (이미지)R-CNN vs YoloTech/머신러닝 2020. 2. 25. 08:56
Detecion 을 위해 두가지 방법을 비교 하려고한다. R-CNN 와 Yolo 인데 Object Detector 를 만들기위해 어떤 알고리즘을 사용할지 고민을 많이 했고 그중 이 두가지를 비교 하려고 한다. R-CNN R-CNN은 Multi-stage pipeline임. 학습이 복잡함. R-CNN에서 SVM으로 만들어져있던 classifier 등을 neural network으로 변경함 ROI Pooling 제안으로, 효율성을 높임. 9개의 박스 형태를 가지고 이미지에서 영역을 대조함. 앵커박스와 정답박스를 서로 비교하여 나온 수치 ( Iou ) 중에 높은 수치인것들만 검출함. top 300, NMS 를 사용하여 후보군을 줄일수 있음. Vgg16 512 필터 사용 -> 박스 영역 계산/ 오브젝트 존재 유..
-
[ 딥러닝 ](이미지)Object Detector -시작하기Tech/머신러닝 2020. 2. 24. 17:29
딥러닝이 가장많이 쓰이는 부분은 이미지 처리 인거 같다. 실제 지금 다니는 회사에서도 가장 메인으로 개발중인건 이미지에서 무엇인가를 찾는것이다. 그래서 여기에 내가 현재까지 이해한 부분들을 기록으로 남기려고 한다. 머리가 나빠서 자꾸 까먹는다... 일단 여기서 무엇인가가 중요한거 같다. 딥러닝은 말그대로 정답지를 무수히 인공지능에게 보여줘서 이 화면에 있는것이 어떤 물건인지 알려주는것이다. 그렇다면 어떤방식으로 학습을 시키고 그 결과를 확인하고 테스트하고 사용할지 , 일반적인 사람들 생각에는 굉장히 막연할거 같다. 나도 물론 처음 접할땐 막연했고 인공지능은 수학에 가까운것이 아닌가 ? 라는 생각을 했다. 인공지능 = 알파고 라고 보통 생각을 많이 하고 있고, 개발자들에게는 미래가 유망한 분야이지만 나랑은..