논문 링크:
Universal Joint Source-Channel Coding for Modulation-Agnostic Semantic Communication
From the perspective of joint source-channel coding (JSCC), there has been significant research on utilizing semantic communication, which inherently possesses analog characteristics, within digital device environments. However, a single-model approach tha
ieeexplore.ieee.org
출처: Y. Huh, H. Seo and W. Choi, "Universal Joint Source-Channel Coding for Modulation-Agnostic Semantic Communication," in IEEE Journal on Selected Areas in Communications, vol. 43, no. 7, pp. 2560-2574, July 2025.
요약
기존의 여러 semantic 통신 방법들은 아래 그림의 (a)와 같이 각 변조 방식(modulation order)마다 별도의 인코더-디코더 모델을 학습하고 저장해야했다. 이는 학습 복잡도를 증가시키고 하드웨어 자원을 낭비하기에 비효율적이다. 이에 대한 해결책으로 이 논문에선 다양한 변조 방식을 하나의 단일 모델에서 지원하는 universal joint source-channel coding (uJSCC) 방법을 최초로 제안한다.

uJSCC는 이미지 전송을 위한 point-to-point semantic 통신 시스템을 디자인한다. 아래 그림과 같이 SNR 값에 따라 변조 방식 k를 선택한 후 시스템은 인코더 → VQ → 변조 → 채널 전송 → 디코더 → 복원 순서로 동작한다. 이 논문의 주요 목표는 아래 그림과 같은 통신 프레임워크 전체를 최적화하는 것이다.

여러 경로에서 동일한 Batch Normalization(BN) 레이어를 공유하는 경우 각 경로의 입력 특성이 다르기 때문에 출력 통계가 균일하지 않게 되는 문제가 발생할 수 있다. 이를 해결하기 위해 각 신경망 NN이후의 modulation order를 기반으로 BN레이어를 통합하고 변조 방식에 알맞는 레이어를 선택한다. 다시 말해, uJSCC는 각 변조 방식마다 별도의 BN 층을 두고(K개의 BN층) 변조 방식이 달라지면 해당 방식에 맞는 BN층을 선택해서 사용한다. 이를 통해 각 데이터 처리 경로의 통계적 특성을 안정적으로 관리할 수 있다. 제안한 s-BN 방식은 아래 그림의 (a)와 같이 출력 분포를 유사한 형태의 곡선으로 잘 정규화해 나타낸다. 하나의 BN 층을 공유하는 (b)는 출력 분포가 서로 다른 통계적 특성을 갖는다. 또한 이 BN 레이어의 크기는 전체 모델 크기의 1~2% 정도로 전체 모델 크기에 최소한의 영향을 미친다.

아래의 표에서 확인할 수 있듯, uJSCC는 모든 변조 방식이 공유된 구조로 동시에 학습하기에 적은 epoch수로 학습을 완료할 수 있다. 이와 달리 TE는 변조 방식마다 별도의 인코더-디코더와 코드북을 학습해야 하며 변조 차수가 높아질수록 epoch수가 커진다. 즉, uJSCC는 공유된 구조를 통해 epoch 수를 줄이기에 학습 효율성이 뛰어나다.

아래 그림은 여러 baseline과 uJSCC를 이미지 복원 성능 면에서 비교한다. uJSCC는 여러 변조 방식을 하나의 모델에서 공동으로 학습 하기에 고차 변조 방식에서 학습된 능력이 저차 변조 방식에도 도움이 되어 낮은 변조 방식에서의 이미지 복원 성능에 도움이 된다. 성능 곡선은 물결 모양(wave-like)으로 나타나는데 이는 각 변조 방식별 SNR 범위가 다르고 높은 SNR에서는 낮은 SNR에서와 달리 성능이 수렴하기 때문이다. 따라서 전체 성능 곡선은 다섯 개의 변조 방식 곡선이 이어 붙여진 형태로 나타난다. ME1 방식은 s-BN층이 없기에 변조 방식별로 출력 통계 차이를 제대로 보정하지 못해 성능이 상대적으로 떨어진다.

또한 ablation study를 통해 다중 BN 모듈을 사용하는 것이 더 효과적이라는 것을 검증했다.

이와 같이 이미지 전송과 재복원에 대해 실험한 결과, 제안하는 uJSCC는 기존 디지털 의미 통신보다 모델 복잡성, 통신 효율성 그리고 과제 수행 능력에서 더 우수한 성능을 보였다. uJSCC는 작은 구조부터 큰 구조까지 모델 규모에 의존하지 않고 범용적으로 잘 작동했다. 또한, 더 많은 심볼을 전송하는 상황에서도 성능이 유지되거나 향상되었으며 저해상도 이미지뿐 아니라 고해상도 이미지에서도 우수한 성능을 보였다.
발전 방향 및 한계
- Learnable SNR Boundaries: SNR 경계값을 직관적으로 설정하는 대신 학습 가능한 SNR 경계를 도입해 더 최적화된 변조 선택을 할 수 있도록 개선할 수 있다.
- Power-efficient codeword assignment: 제안된 방법은 평균 전력 제약 조건을 포함하지 않으며 코드워드 사용의 균일성을 정규화하는 메커니즘이 없다. 즉 이는 실용적 적용에 제약이 있다.
- SNR-adaptive feature generation: 채널 상태에 따라 feature를 적응적으로 생성할 수 있다. 보조 신경망을 통해 SNR 값에 따라 VQ 코드북을 미세 조정하여 최적의 코드북 매핑을 적용할 수 있다. 이를 통해 이미지 전송 및 복원 성능을 안정적으로 유지할 수 있다.
- 실험은 AWGN 환경에서만 진행되었으며 현실적인 채널 환경에 대한 검증이 부족할 수 있다.