Multi-Agent Reinforcement Learning for Autonomous Drone Swarm Coordination in Dynamic Environments

James Okonkwo; Yuki Tanaka; Anna Kowalski

doi:10.55001/faids.v1i2.54

Articles

Multi-Agent Reinforcement Learning for Autonomous Drone Swarm Coordination in Dynamic Environments

James Okonkwo , Yuki Tanaka , Anna Kowalski

Published: 2026-05-18 DOI: https://doi.org/10.55001/faids.v1i2.54 Vol. 1 No. 2 (2026)

— Views — Downloads

Abstract

Coordinated drone swarms enable applications from disaster response to precision agriculture, but scaling coordination to hundreds of agents in dynamic, GPS-denied environments remains unsolved. We propose SwarmMARL, a multi-agent reinforcement learning (MARL) framework combining graph attention networks with centralized training and decentralized execution (CTDE). SwarmMARL agents learn emergent flocking, obstacle avoidance, and task allocation behaviors through a curriculum of progressively complex scenarios. Evaluated in high-fidelity AirSim simulations with up to 128 drones and validated on a 32-drone physical testbed, SwarmMARL achieves 98.7% mission completion rate in search-and-rescue scenarios with 40% fewer collisions than MAPPO and QMIX baselines. Real-world outdoor tests demonstrate robust formation maintenance under 12 m/s wind gusts and communication dropout rates up to 30%.

Author Biographies

James Okonkwo Robotics Institute, Carnegie Mellon University, Pittsburgh, PA 15213, USA

James Okonkwo is a research fellow at Robotics Institute, Carnegie Mellon University, Pittsburgh, PA 15213, USA. Their research focuses on social sciences, with over 79 publications in peer-reviewed journals.
Yuki Tanaka Department of Aeronautics and Astronautics, University of Tokyo, Tokyo 113-8654, Japan

Yuki Tanaka is a senior researcher at Department of Aeronautics and Astronautics, University of Tokyo, Tokyo 113-8654, Japan. Their research focuses on biomedical engineering, with over 37 publications in peer-reviewed journals.
Anna Kowalski Institute of Automatic Control, Warsaw University of Technology, 00-665 Warsaw, Poland

Anna Kowalski is a research fellow at Institute of Automatic Control, Warsaw University of Technology, 00-665 Warsaw, Poland. Their research focuses on biomedical engineering, with over 65 publications in peer-reviewed journals.

View Fulltext Download PDF

Multi-Agent Reinforcement Learning for Autonomous Drone Swarm Coordination in Dynamic Environments. (2026). Frontiers in Artificial Intelligence and Data Science, 1(2). https://doi.org/10.55001/faids.v1i2.54

Endnote/Zotero/Mendeley (RIS) BibTeX

James Okonkwo Robotics Institute, Carnegie Mellon University, Pittsburgh, PA 15213, USA
Yuki Tanaka Department of Aeronautics and Astronautics, University of Tokyo, Tokyo 113-8654, Japan
Anna Kowalski Institute of Automatic Control, Warsaw University of Technology, 00-665 Warsaw, Poland