Portfolio
박태수 | Portfolio
석사과정 연구원 (Digital Media Lab.)
Email: taesoo0707@kw.ac.kr
📄 Publications & Research Outputs
📝 Journal
- BemaGANv2: Discriminator Combination Strategies for GAN-based Vocoders in Long-Term Audio Generation
- ICT Express (Under Review) preprint
🌍 International Conferences
- AuDiTory: Audio-driven Diffusion for Storyboard Generation via Audio-Text Multi-Modal Fusion
- ECCV 2026 (Submitted)
- AI-Based Adaptive Audio Generation with Frequency-Specific Processing
- ICGHIT 2026
- BemaGANv2: A Vocoder with Superior Periodicity Capture for Long-Term Audio Generation
- ICAIIC 2026 (Selected Paper) link
🇰🇷 Domestic Conferences
-
BemaGANv2의 짧은 시간 오디오 복원 성능 저하에 대한 이론적 분석, 한국방송미디어공학회
-
BemaGAN: 다중 엔벨로프 판별기를 적용한 생성적 적대 신경망, 대한전자공학회
🔬 Research Projects
-
생성형 AI 기반 이명 치료제 개발 (이화여대 목동병원, 2024~)
-
EMG 기반 의족 제어 시스템 (서울아산병원, 2025~)
🧾 Patent
- 이명 치료 음원 생성 장치 및 방법
- 출원번호: 10-2024-0093918
🚀 Projects
🎧 1. 개인 맞춤형 이명 디지털 치료제 (Generative AI 기반)


🦿 2. 로봇 의족 동작을 위한 실시간 생체 신호 분석


📌 Summary
-
GAN 기반 Vocoder 연구 (BemaGANv2)
-
Audio-driven Diffusion (AuDiTory)
-
의료 AI (이명 치료, EMG 분석)
-
실제 서비스/임상 적용 경험 보유