박태수 | Portfolio

석사과정 연구원 (Digital Media Lab.)

Email: taesoo0707@kw.ac.kr


📄 Publications & Research Outputs

📝 Journal

  • BemaGANv2: Discriminator Combination Strategies for GAN-based Vocoders in Long-Term Audio Generation

🌍 International Conferences

  • AuDiTory: Audio-driven Diffusion for Storyboard Generation via Audio-Text Multi-Modal Fusion
    • ECCV 2026 (Submitted)
  • AI-Based Adaptive Audio Generation with Frequency-Specific Processing
    • ICGHIT 2026
  • BemaGANv2: A Vocoder with Superior Periodicity Capture for Long-Term Audio Generation
    • ICAIIC 2026 (Selected Paper) link

🇰🇷 Domestic Conferences

  • BemaGANv2의 짧은 시간 오디오 복원 성능 저하에 대한 이론적 분석, 한국방송미디어공학회

  • BemaGAN: 다중 엔벨로프 판별기를 적용한 생성적 적대 신경망, 대한전자공학회

🔬 Research Projects

  • 생성형 AI 기반 이명 치료제 개발 (이화여대 목동병원, 2024~)

  • EMG 기반 의족 제어 시스템 (서울아산병원, 2025~)

🧾 Patent

  • 이명 치료 음원 생성 장치 및 방법
    • 출원번호: 10-2024-0093918

🚀 Projects

🎧 1. 개인 맞춤형 이명 디지털 치료제 (Generative AI 기반)

🦿 2. 로봇 의족 동작을 위한 실시간 생체 신호 분석


📌 Summary

  • GAN 기반 Vocoder 연구 (BemaGANv2)

  • Audio-driven Diffusion (AuDiTory)

  • 의료 AI (이명 치료, EMG 분석)

  • 실제 서비스/임상 적용 경험 보유