DINHO's Blog
This is a space where I fulfill my infinite dreams
-
정보의 측정 Meaure of Information
2월 28일에 포스팅을 하고 한 달 하고 조금 더 걸려서 돌아왔네요…😶😶 그 동안 개강하고 캡스톤 제안서 쓰랴 발표하랴 조사하랴 정신이 없어서 이제서야 글을 올립니다. 😊😊 오늘은 정보이론에 대해 이야기해볼까 합니다. 학부 4학년 1학기를 다니고 있는 지금 제가 배우고 있는 과목입니다. 보통 대학원 과목인 경우가 많은데, 최근에는 여러 학교에서 정보이론을 학부...
-
VAE(Variational autoencoder)란?
오늘은 VAE(Variational autoencoder)에 대해서 이야기해보겠습니다. VAE에 대해 처음으로 소개한 논문은 Kingma와 Welling에 의해 2013년에 작성된 “Auto-Encoding Variational Bayes”입니다. 이 논문에서는 VAE의 기본 원리와 함께, 딥러닝을 이용한 변분 베이지안 추론(Variable Bayesian Inferench)의 새로운 방법을 제시했습니다. 이 논문은 VAE의 이론적 기반을 마련하고, 다양한 분야에서의 응용 가능성을 열어준 중요한 작업으로 평가받고 있습니다. 수식적으로...
-
HiFi-GAN 이란?
오늘 주제는 HiFi GAN입니다. HiFi는 high-fidelity의 줄임말로 “음향에서 원음과 원화에 충실한 재현”의 뜻을 갖고 있습니다. 오늘은 다음 논문의 내용을 리뷰하고 정리하여 HiFi GAN에 대하여 설명해보겠습니다. Kong, J., Kim, J., & Bae, J. (2020). Hifi-gan: Generative adversarial networks for efficient and high fidelity speech synthesis. Advances in Neural Information Processing Systems,...
-
스펙트로그램 & 멜-스펙트로그램 with Python
오늘은 스펙트로그램과 멜-스펙트로그램을 Python에서 다루어보도록 하겠습니다. 설 연휴가 끝나고 오랜만에 게시글을 올리는 만큼 무겁지 않은 주제로 가져와봤습니다😃😃 지난번 FFT with Python 에서 같이 FFT를 적용하고 시간 도메인과 주파수 도메인에서 스펙트럼을 확인해봤었죠?? 이번엔 스펙트럼과 함께 스펙트로그램, 멜-스펙트로그램을 한 눈에 볼 수 있는 Python 코드를 실습해보겠습니다. 먼저 멜-스펙트로그램을 보기 위해서는 librosa 라이브러리를...
-
Diffusion 설명
최근 오디오 생성형 AI 모델에 대한 연구가 활발히 진행중입니다. 그 중에서도 가장 최신 모델인 Auffusion과 AudioLDM2에 대한 논문을 보았는데요. 각 모델에 대한 자세한 정보는 링크를 타고 들어가시면 볼 수 있습니다. 두 모델 모두 Diffusion, HiFi-GAN, Transformer, VAE 등 공통적으로 알아야할 내용들이 있습니다. 그래서 이번 게시글에서는 먼저 공통적으로 알아야할 내용중 Diffusion에...