• MusicGen 이란?

    안녕하세요! 오늘은 MetaAI에서 공개한 MusicGen에 대해 알아보겠습니다. 이 모델은 아카이브에 공개된 “Simple and Controllable Music Generation(01.2024)” 논문에서 처음 소개했습니다. 오늘은 이 논문 리뷰를 하겠습니다. 먼저 간단하게 MusicGen에 대해 요약하여 설명 드리겠습니다. MusicGen은 조건부 음악 생성의 경계를 재정의하는 강력한 단일 언어 모델로, 텍스트 설명이나 멜로디에서 단서를 얻어 고품질 음악을 생성합니다. 논문에서...


  • 딥러닝 소개

    안녕하세요!! 오늘부터 딥러닝 시리즈를 포스팅해볼까 합니다😏😏 이 시리즈의 글들은 MIT 6S191 수업을 바탕으로 정리한 글입니다. 출처를 남기지 않은 이미지는 이 수업 자료 이미지입니다. 오늘은 딥러닝이란 무엇인지!! 딥러닝에 대해 소개해보도록 하겠습니다. What is Deep Learnig? 인공지능 제가 인공지능 분야를 처음 공부할 때 가장 헷갈렸던 부분은 인공지능, 머신러닝, 딥러닝의 차이입니다.(사실 지금도 헷갈립니다…)...


  • 기본적인 영상처리

    지난번 C언어로 Raw파일의 입출력 코드를 살펴 봤었는데요. 오늘은 Raw 파일을 읽고 이미지의 색 반전, 밝기 조절, 이미지 회전 등의 기본적인 영상 신호 처리 과정을 함께 해보도록 하겠습니다. 관련 이론을 먼저 소개해 드리고 이후에 C코드를 살펴보겠습니다. 지난번 색 공간 에서 한 픽셀에 0~255 사이의 값으로 정보를 가지고 있다는 말 기억하시나요? 그때...


  • 파일 입출력 in C

    안녕하세요. 오늘은 C언어 공부를 하면서 풀었던 예제를 공유하겠습니다. 앞으로도 제가 풀었던 C예제를 계속 공유하겠습니다!! 이번 예제는 간단히 raw 이미지파일을 읽어 들이고, 그것을 출력 버퍼에 복사한 뒤 다시 다른 파일에 그대로 쓰는 것으로, 이미지에 아무런 처리를 하지 않았기 때문에 완전히 똑 같은 이미지 하나를 만들어내는 것입니다!! 아래는 예제 코드입니다. 예시 입력...


  • Stereo Channel with python

    스테레오 채널에서 바이노럴 비트(Binaural Beats)를 삽입하고, 왼쪽과 오른쪽에 다른 주파수를 출력하여 뇌가 하나의 음으로 인지하게 하는 python 코드를 소개해드리겠습니다. 먼저 스테레오는 동시에 하나 이상의 스피커에 맞춰 데이터를 사용하는 2채널 재생 및 녹음을 뜻합니다. 최근에는 영화관이나 텔레비전의 서라운드 사운드 5.1~6.1 채널 시스템과 같이 여러 개의 채널을 포함할 수도 있습니다. 그리고 스테레오...