DINHO's Blog
This is a space where I fulfill my infinite dreams
-
Mel-Spectrogram&MFCC 비교(with Cepstrum)
오늘은 멜-스펙트로그램(Mel-Spectrogram)과 MFCC에 대해서 이야기해보겠습니다!! 그러기 위해서 알아야 할 것!! 지난번 음성 신호 처리 기초에서 Envelop에 대해 공부했었죠? 마지막에 Cepstrum(캡스트럼)에 대해 이야기 해보겠다 했는데요. MFCC를 이해하기 위해서 Cepstrum의 개념이 필요합니다!! 이번 게시글에서 Cepstrum의 개념도 함께 공부해보도록 하겠습니다. 캡스트럼(Cepstrum) \[1) s[n] = x[n]*h[n]\] \[2) S(f) = X(f)H(f)\] 이 사진과 공식 기억나시나요??...
-
FFT with Python
오늘은 디지털 신호처리의 기초!! FFT에 대해서 아주 간단하게 언급하고 Python과 함께 직접 적용해보도록 하겠습니다. 이 글은 기본적인 디지털 신호 처리 과정, DFT의 내용을 알고 있다고 생각하고 글을 쓰겠습니다😄 나중에 기회가 된다면 신호 처리 생초보를 위한 디지털 신호 처리 이론도 다루어보도록 하겠습니다😋😋 FFT 기초 FFT(Fast Fourier Transform)는 DFT(Discrete Fourier Transform)를 빠르게...
-
과비음 (Hypernasality) 측정 딥러닝 알고리즘 논문 리뷰2
지난번에 이어서 “Mathad, Vikram C., et al. “A deep learning algorithm for objective assessment of hypernasality in children with cleft palate.” IEEE Transactions on Biomedical Engineering 68.10 (2021): 2986-2996.” 논문 리뷰를 이어서 하겠습니다. 지난번 논문 리뷰1에서는 구개열(Cleft Palate)과 구강, 비강 조음들을 알아보았는데요. 이번에는 본격적으로 데이터셋이나 어떤 구조의 DNN 모델인지 알아보도록...
-
Flutter&Firebase 오류 해결
무조건 해결하자!! PlatformException (PlatformException(sign_in_failed, com.google.android.gms.common.api.ApiException: 10: , null, null)) 플루터로 개발을 하다가 이런 오류를 보신 적 있으신가요? 보통 Firebase를 이용해서 구글 로그인을 할 때 생기는 문제인데요. 요악하자면 SHA-1키 문제입니다. 구글에 검색해보시면 여러 방법인 나오지만 저는 아무리 해도 안 되더라고요 ㅠㅠㅠ 그래서 이것저것 시도해 본 결과! 무조건 해결 가능한 방법을 찾았습니다....
-
음성 신호 처리 기초
오늘은 음성 신호 처리에 대해서 이야기해볼까 합니다😄 대부분의 생성형 오디오 AI 모델이 학습을 할 때 소리를 이미지로 바꾸는 전처리 과정을 거쳐 학습합니다. 이러한 전처리 기술은 오디오 데이터를 더 의미 있는 형태로 변환하여 AI 모델이 효과적으로 학습하고, 더 정확한 예측을 할 수 있도록 도와줍니다. 오디오 신호의 복잡성을 줄이면서 중요한 특징을 추출하는...