논문 링크:
Large Language Model Enhanced Multi-Agent Systems for 6G Communications
The rapid development of the Large Language Model (LLM) presents huge opportunities for 6G communications, e.g., network optimization and management by allowing users to input task requirements to LLMs by nature language. However, directly applying native
arxiv.org
출처: F. Jiang, L. Dong, Y. Peng, K. Wang, K. Yang, C. Pan, D. Niyato, and O. A. Dobre, "Large Language Model Enhanced Multi-Agent Systems for 6G Communications," arXiv:2312.07850 [cs.AI], Dec. 2023.
요약
LLM의 빠른 발전은 6G 통신에 큰 기회를 제공한다. 사용자는 자연어로 요구 사항을 입력하면 네트워크가 최적화나 관리 작업을 수행한다. 하지만 기존 LLM을 6G에 그대로 적용하면 개인 통신 데이터 부족, 논리적 추론·평가·개선 능력의 한계 등 여러 문제가 발생한다. 이러한 한계를 극복하기 위해 LLM에 검색, 계획, 메모리, 평가, 반성(reflection) 기능을 갖춘 에이전트를 결합하면 6G 통신에서 LLM의 잠재력을 크게 높일 수 있다. 이를 위해, 저자들은 통신에 맞춤화된 멀티 에이전트 시스템을 제안하며, 이를 통해 자연어로 통신 관련 문제를 해결할 수 있도록 한다. 이러한 멀티 에이전트들은 크게 3가지 요소로 정리된다:
- MDR — Multi-agent Data Retrieval: 지식 베이스에 저장된 통신 관련 문서·표준·논문 등에서 필요한 정보를 찾아내고 요약해 LLM의 통신 지식 범위를 확장한다.
- MCP — Multi-agent Collaborative Planning: MDR에서 얻은 지식을 기반으로 여러 계획 에이전트가 서로 다른 관점에서 문제 해결 방안을 생성한다.
- MER — Multi-agent Evaluation and Reflexion: MCP가 만든 여러 해결안을 평가하고, 반성(reflexion)과 개선(refinement)을 통해 더 나은 해결안을 만들도록 피드백 제공한다.
끝으로 연구진은 제안한 LLM 기반 멀티 에이전트 시스템이 효과적인지 검증한다. 이를 위해 SC 시스템을 직접 설계하고 평가한다.
Fig. 1: LLM 기반 에이전트 시스템
- Agent: 에이전트는 모델을 호출해 자연어 이해, 추론, 계획, 코드 생성과 같은 고차원 작업 수행
- Profile: 에이전트의 성격, 역할, 목표, 행동 규칙을 정의하는 설정값.
- Knowledge Base: Agent는 필요할 때 여기에 접근해 최신 통신 표준, 논문, 기술 문서와 같은외부 데이터 를 검색하고 요약해 문제 해결
- Tools: 에이전트가 실제 작업을 수행할 때 사용하는 실행 도구 세트로 에이전트는 모델의 판단을 바탕으로 tools를 호출해 계산, 시뮬레이션, 데이터 처리, 코드 실행과 같은 실제 작업 수행
- Memory: 에이전트는 메모리를 통해 이전 시도와 결과를 참고해 자기 반성, 개선 수행

Fig. 2: LLM 기반 Multi-Agent System의 세 가지 핵심 모듈
MDR (Multi-agent Data Retrieval): 외부 통신 도메인 지식을 LLM이 활용할 수 있도록 정제·요약하여 도메인 지식으로 변환
- 문서 분할 (Document Segmentation): 최신 통신 표준, 논문, 문서 등 외부 데이터 로딩, 의미 단위로 문서를 분할해 검색 효율을 높임
- 지식베이스 구축 (Knowledge Base Construction): 분할된 문서를 임베딩하여 벡터로 변환, 문서 조각과 임베딩을 벡터 DB 형태로 저장
- 문서 검색 (Document Retrieval): Secure Agent가 사용자 요구를 검증해 보안 위협 차단, 요구사항을 임베딩 후 벡터 DB와 비교, MMR(Maximal Marginal Relevance)로 중복 최소화하며 관련 문서 선택
- 압축 및 요약 (Compression & Summarization): Condensate Agent가 불필요한 정보 제거, Inference Agent가 선택된 문서 조각을 기반으로 사용자 요구에 맞는 통신 도메인 지식을 자연어로 생성
MCP (Multi-agent Collaborative Planning): 도메인 지식, 사용자 요구에 기반해 여러 에이전트가 협력해 해결 계획 생성
- 작업 계획 수립 (Task Planning): 여러 Planning Agent가 CoT 또는 Plan-and-Solve 방식으로 원래의 복잡한 문제를 여러 개의 하위 작업(sub-tasks)으로 분해
- 서브태스크 체인 구성 (Sub-task Chain Construction): 하위 작업 간 순서·의존성을 고려해 일련의 작업 체인(sub-task chain)으로 병렬/순차 구조 구성
- 서브태스크 체인 실행 (Solving Sub-task Chains): 각 서브태스크는 LLM 내장 도구, 외부 커스텀 통신 도구 등을 호출해 해결, 체인의 마지막 단계에서 최종 결과가 생성
MER (Multi-agent Evaluation and Reflexion): MCP가 만든 여러 해결안의 품질을 평가하고, 개선 방향을 제시해 시스템을 반복적으로 최적화
- 결과 평가 (Result Evaluation): Evaluation Agent가 각 서브태스크 체인의 결과를 평가, 보상(reward)을 계산해 품질 정량화
- 메모리 저장 (Memory Storage): 현재 체인을 과거 체인과 비교, 의미적으로 새로운 체인은 장기 메모리(LTM), 유사한 체인 단기 메모리(STM)에 저장, 결과와 보상도 함께 저장
- 성찰Introspection): Reflexion Agent가 단기 메모리에 기반해 세부적·미시적 개선점 도출
- 정제(Refinement): Refinement Agent가 장기 메모리에 기반해 구조적·거시적 개선점 제시
- 피드백 루프 (Feedback Loop): 개선 제안이 MCP로 다시 전달, 새로운 서브태스크 체인 생성하여 MER 평가, 반복하며 최적 솔루션에 수렴

Fig. 3: LLM‑Enhanced Multi‑Agent System 기반 SC모델 구현
1. 사용자 요구 분석 (User Requirements)
- Secure Agent: 사용자 요구가 보안적으로 안전한지 검증
- Condensate Agent: 사용자 요구를 핵심 의미만 남기고 압축
- Inference Agent: 정제된 요구를 기반으로 초기 문제 정의 생성
2. 도메인 지식 추출 (Domain Knowledge Extraction)
- Semantic Encoder: 의미 단위 표현 방식, 기능 정의
- Channel Encoder: 채널 부호화 방식, 목적
- Physical Channel: 채널 모델, 잡음 특성
- Channel Decoder: 복호화 방식
- Semantic Decoder: 의미 복원 방식
- Training Method: 학습 전략, 목적 함수, 데이터 요구사항
3. 설계 단계 (Scheme Design)
- Semantic Encoder: 구조(예: LSTM, Transformer). 입력/출력 형태
- Channel Encoder / Decoder: MLP, CNN 등 구조, 입력/출력 차원
- Physical Channel: AWGN, Rayleigh 등 채널 모델, 파라미터(잡음 세기 등)
- Semantic Decoder: 구조 및 출력 형태
- Training Method: Loss function, Optimizer. 학습 전략
4. 코드 구현 (Code Implementation)
- Semantic Encoder: LSTM 코드, Feedforward 코드
- Channel Encoder / Decoder: MLP 코드, Feedforward 코드
- Physical Channel: 채널 모델 코드, 채널 파라미터 설정
- Semantic Decoder: LSTM/MLP 기반 복원 코드
- Training Method: 데이터 처리 코드, 역전파(backpropagation) 코드, 학습 루프
5. 평가 및 개선 (Evaluation & Refinement)
- 평가(Evaluation): 코드 품질, 목적 함수 값, 제약 조건 위반 여부(패널티)
- 내성(Introspection): 코드 문법 오류, 파라미터 조정 필요성, 모듈 간 연결 문제
- 정제(Refinement): 논리적 오류 수정, 구조적 개선, 더 효율적인 모델 구조 제안
- 피드백 루프: 개선 사항이 다시 Planning Agent로 전달, 새로운 설계·코드 생성, 반복하며 최적화
- 결과: 점진적으로 개선된 SC 모델 완성

시뮬레이션 결과
아래 Fig. 4는 멀티에이전트 기반 시맨틱 통신 시스템에서 반성(introspection) 반복 횟수가 증가할수록 모델의 평가 점수(evaluative score)가 어떻게 향상되는지를 보여준다. 반복 횟수가 증가할수록 Scheme 2가 더 좋은 평가 점수를 달성하며 이는 Scheme 2가 LSTM 기반 모델로 구성되어 시퀀스 정보를 더 잘 처리하기 때문이다.

다음 실험 결과는 시맨틱 통신 시스템에서 SNR이 높아질수록 의미적 유사도가 어떻게 변하는지를 보여준다. 이는 멀티 에이전트 기반 SC 시스템 설계가 SNR 변화에 따라 의미 보존 성능이 안정적으로 증가함을 보여주는 실험적 증거이다.

한계 및 발전 방향
1) Limited Resources (자원 제약 문제): 멀티에이전트 시스템은 LLM과 사설 통신 데이터를 활용해야 한다, 그러나 엣지 디바이스는 클라우드에 비해 자원이 매우 부족하다.
2) Cooperation and Competition (협력과 경쟁 문제): 현재 제안된 멀티에이전트 시스템은 모든 에이전트가 협력(cooperation)하는 구조다. 하지만 LLM 기반 멀티에이전트 시스템은 경쟁(competition), 혼합 전략, 역할 분리 등 다양한 상호작용 방식을 이용할 수 있다.
3) Real-time Interaction (실시간 상호작용 문제): LLM 기반 에이전트가 실시간 6G 환경에서 동작하려면 속도 문제를 해결하는 새로운 기술이 필요하다.