Wireless Communications

[논문 리뷰] Agentic AI-Enhanced Semantic Communications:Foundations, Architecture, and Applications

은최 2026. 2. 20. 11:24

논문 링크:

 

Agentic AI-Enhanced Semantic Communications: Foundations, Architecture, and Applications

Semantic communications (SemCom), as one of the key technologies for 6G, is shifting networks from bit transmission to semantic information exchange. On this basis, introducing agentic artificial intelligence (AI) with perception, memory, reasoning, and ac

arxiv.org

 

출처: H. Gao, M. Sun, R. Zhang, Y. Wang, X. Xu, N. Ma, D. Niyato, and P. Zhang, “Agentic AI-Enhanced Semantic Communications: Foundations, Architecture, and Applications,” arXiv preprint arXiv:2512.23294, 2025.


Fig. 1 - agentic AI-enhanced SemCom architecture: 전체적으로 세 계층이 신호를 주고받으며 지능형·적응형 semantic 통신 시스템을 구성한다.

 

Application Layer

  • Intent Formulation & Signaling: 사용자 intent를 수집하고 구조화된 intent description으로 변환
  • Multi‑task Execution: 복원된 semantic 정보를 실제 작업에 활용
  • QoS Assessment: semantic reconstruction quality 지표에 기반해 피드백 신호 생성

Semantic Layer

  • Semantic Extractor: 텍스트/이미지/비디오 등 멀티모달 semantic feature 추출
  • JSCC Encoder / Decoder: semantic feature를 variable‑length로 인코딩, semantic importance 기반 selective protection
  • RL‑based Resource Control: CSI, QoS feedback등을 입력 받아 네트워크 자원을 상황에 맞게 최적화

Cloud‑Edge Collaborative Layer

  • Multimodal‑based Knowledge Base (KB): speech/text/image semantic features 저장
  • Codebook‑based KB: semantic feature를 벡터/코드북 형태로 저장하여 semantic compression 및 retrieval에 활용
  • LLM/LVM Agents: 사용자 intent 해석, Semantic model orchestration
  • Model Orchestration & Resource Scheduling: intent, QoS score에 기반하여 더 강력한 semantic model 선택


Fig. 2 - agentic AI‑Enhanced SemCom: 세 가지 대표 응용 시나리오에서 Agentic AI와 SemCom이 어떻게 상호작용하는지 보여준다.

 

Multi‑Vehicle Collaborative Perception

  • 차량·도로 인프라의 센싱: 교통 신호를 SemCom의 semantic extractor, JSCC encoder로 압축
  • SemCom 전송: 차량 간 저지연 링크로 전송, Semantic-level 압축 덕분에 대역폭 절감, JSCC가 낮은 SNR에서도 의미 보존
  • 수신/응급 차량 Agentic AI 처리: LLM/LVM agent가 멀티모달 이해 수행, 구조화된 의미 추출, 과거 기록과 결합해 의미 강화
  • 행동 결정: 차량에게 회피, 양보, 우회 경로 지시, 응급 차량은 실시간 상황 인지 기반 경로 최적화
  • RL 기반 자원 제어: RL agent가 정보 중요도, 채널 상태, 우선순위를 기반으로 대역폭·비트레이트·우선순위·모델 선택을 조정

 

Multi‑Robot Cooperative Rescue

    • UAV/로봇의 센싱: SemCom의 semantic extractor + JSCC encoder로 처리
    • SemCom 기반 전송: 산악 지형·저 SNR 환경에서도 의미 중심 전송
    • Command Center의 Agentic AI 처리: LLM/LVM agent가 영상·신호를 분석, 구조 우선순위 판단
    • RL 기반 네트워크 제어: Base station의 RL agent가 네트워크 최적화

 

Agentic Operations for Intellicise Networks

  • 다양한 서비스 트래픽 입력: History traffic, User video, VR/AR, Digital twin 등등...
  • Agentic AI 기반 신호 처리: Embedded AI가 신호 특성에 따라 적절한 알고리즘 선택, 지연·에너지 최적화
  • Intellicise SemCom: 사용자 요구·우선순위에 따라 semantic model orchestration 수행
  • RL 기반 자원 제어: Base station RL agent가 Priority scheduling, Bandwidth allocation, Model switching을 수행
  • 서비스 운영 최적화: Agent가 지속적으로 intent·트래픽 패턴 분석, 서비스 모드 동적으로 변경


Fig. 3 - AKB‑JSCC Framework: 세 개의 지식 기반(KB)이 JSCC 파이프라인을 강화하는 구조를 보여준다.

 

Agentic KB-based JSCC Framework

  • Semantic Extractor: 입력 이미지 통해 semantic feature map 생성
  • Entropy Model: feature map의 각 위치에 대해 Gaussian mean/variance 추정
  • JSCC Encoder: feature map + entropy map + source KB에서 온 cross‑modal embedding
  • Wireless Channel 전송: SNR 조건이 변해도 semantic‑aware JSCC 유지
  • JSCC Decoder + Semantic Restorer: Cross‑modal transformer 기반 복원, 최종 restored image 출력

 

LLM/LVM Agent‑based Source KB

  • 이미지/프롬프트 입력 → LLM/LVM, 이미지의 의미를 요약한 concise description 생성
  • Text Tokenizer → Token IDs  → Text Encoder → Embedding r 생성
  • Embedding Retrieval: r을 query로 사용해 대규모 multimodal embedding KB에서 가장 가까운 벡터 검색
  • Retrieved embedding → JSCC Encoder/Decoder로 전달

 

RL Agent‑based Channel KB State 

  • State 구성: Entropy, SNR, action map 통합해 state St 생성
  • Feature Extractor: state를 feature로 변환
  • Actor Head / Critic Head: action at, action probability pt, value vt
  • Environment Interaction: action을 JSCC rate control에 적용, reward rt 계산
  • Data Buffer → parameter 업데이트: 여러 step의 (state, action, reward)로 RL 업데이트 수행


Fig. 4 - AWGN 채널 실험 결과: Fig. 4는 AKB‑JSCC가 semantic prior(LLM/LVM)와 channel reasoning(RL)을 결합해, 저 SNR·저 CBR에서도 기존 방식보다 훨씬 높은 복원 품질을 달성함을 정성·정량적으로 입증한 실험이다.

  • Entropy Map & Rate Preset Map: 각 위치의 semantic 정보량, entropy를 기반으로 사전 정의된 rate level
  • AKB‑JSCC는 모든 SNR에서 NTSCC보다 구조·텍스처 보존이 우수
  • AKB‑JSCC는 낮은 CBR에서도 특히 우수
  • Source KB의 기여: LLM/LVM 기반 cross‑modal embedding이 semantic feature를 강화해 복원 품질 향상
  • Channel KB의 기여: RL 기반 rate control이 semantic importance + SNR 결합해 가변 길이 코딩 최적화
  • AKB‑JSCC 전체의 시너지: 두 KB가 결합되어 semantic-aware + channel-adaptive JSCC 완성됨