• Binaural Beat with python

    오늘은 Binaural Beat에 대해 이야기해보겠습니다. 먼저 Beat(맥놀이)란 두 귀로 서로 다른 주파수의 소리를 들었을 때, 뇌가 이 두 주파수의 차이만큼 비트를 생성하여 인지하는 현상입니다. 예를 들어 440Hz와 480Hz 두 주파수가 있다고 생각하고 이러한 사인파를 이용해서 Beat를 생성한다고 생각해봅시다. 그렇다면 함수는 아래와 같습니다. \[440Hz = sin(\pi 440t)\] \[480Hz = sin(\pi 480t)\]...


  • SSIM for color

    오늘은 SSIM(Structural Similarity Index Measure)에 대해서 이야기 해보겠습니다. SSIM은 디지털 TV, 사진, 비디오 등의 인지된 품질을 예측하는 방법입니다. 이 방법은 두 이미지 간의 유사성을 측정하는 데에도 사용돼서 생성형 AI에서는 원본 이미지와 생성 이미지를 비교하기 위해 SSIM을 평가지표로 사용하기도 합니다. SSIM은 두 픽셀 값의 차이로 유사도를 계산합니다. 제가 검색해 봤을 때(저의...


  • 색 공간

    안녕하세요😊😊 오늘은 영상 신호 처리 기초, 그 중에서도 ‘색 공간’을 중심으로 이야기해 보겠습니다. 마지막에는 그레이 스케일을 이해할 수 있는 간단한 C언어 실습도 해보겠습니다. 이미지 기초 픽셀(Pixel) 이미지 데이터는 픽셀이라 하는 작은 이미지 직사각형 형태로 모은 것입니다. 각 픽셀은 한 가지 색의 직사각형이며 전체 이미지 크기는 (세로 픽셀 수 x 가로...


  • 연결 리스트 자료구조

    어느덧 한 학기가 다 지나갔습니다. 4학년 1학기 캡스톤 디자인도 순조롭게 마무리 되었고, 종강 하고 보니 어느덧 햇볕이 땀구슬을 맻히게 하는 계절이 왔습니다. 방학 때는 학기 중보다 더 자주 포스팅을 할 수 있습니다!! 오늘은 지난 번(무려 두 달 전…)에 이어서 연결 리스트에 대해 이야기 해보겠습니다. (코드는 복붙이 아니라 교재 보고 제가...


  • BigVGAN 이란?

    캡스톤 진행, 시험 기간 등 여러 일정들이 겹치면서 블로그 포스팅에 소홀해지는 것 같습니다ㅠㅠ 최대한 꾸준하게 하는 것을 목표로 하고 있는데, 밀린 내용들이 많네요… 5월 중순부터는 스케줄이 넉넉해질 것 같아서 다시 열심히 해보도록 하겠습니다. 오늘은 BigVGAN(Lee, Sang-gil, et al. “Bigvgan: A universal neural vocoder with large-scale training.” arXiv preprint arXiv:2206.04658 (2022).)...