이번 월간 기후송은 작곡 대신 오늘 소개드릴 프로젝트에 대한 글로 대체합니다.
혹시 모르실 분들을 위해 간단히 소개드리면, 저는 기후활동가이자 싱어송라이터로, 가끔 기후환경강의나 작곡강의도 하고 있습니다. 기후활동을 하면서 AI산업이 막대한 전력사용과 그에 따른 어마어마한 온실가스 배출을 한다는 사실을 알게 되었고, 제법 경계하며 지켜보고 있는 중입니다. 그래서 우선 AI가 얼마나 전기를 많이 소비하는지부터 살펴보도록 하겠습니다.
AI산업의 전력 소비량

우리가 ChatGPT(이하 지피티)에 질문 한 번 할 때 소모하는 전력량은, 기존 인터넷 검색의 10배 이상입니다. 또한 재미삼아 의미 없는 그림 한 장을 그리는 작업은, 핸드폰 한 대를 완충하는 전력이 소모됩니다(미국 카네기멜런대와 허깅페이스 연구진 공동 연구, 2023). 그런데 최근 챗GPT와 같은 일반 소비자용 인공지능(AI) 서비스 사용자 수가 전 세계 약 18억 명으로 추정된다는 연구결과를 나왔습니다.1 즉 한 개인의 질문과 그림 하나만 따지면 크지 않은 전력량이지만, 곱하기 18억을 하면 얘기가 달라집니다.
AI산업에서는 데이터센터의 전력 소모량이 상당 부분을 차지하는데, 국제에너지기구(IEA)에 따르면, 2020년 전 세계 데이터센터가 소비한 전력은 남아프리카공화국의 1년 전력 소비량(200~250TWh) 수준이었습니다. 또한 2022년은 460TWh(테라와트시)였는데, 이는 그해 우리나라 전체 전력소비량(568TWh)과 맘먹는 전력량입니다. 게다가 앞으로 2년 뒤에는 최대 2.2배에 달하는 전력이 필요해진다고 하니 증가 속도 또한 엄청납니다(IEA, ‘Electricity 2024 – Analysis and forecast to 2026’).
우리나라 역시 데이터센터 전력 수요가 가파르게 증가하고 있으며, 산업통상자원부에 따르면 국내 데이터센터는 2022년 9월 기준, 147개소에서 2029년 784개소로 늘어날 예정이라고 합니다. 이에 따라 같은 기간 데이터센터 전력 수요 역시 1.8GW에서 2029년 41.5GW까지 증가할 것으로 전망되는데, 이는 원전 약 40기에 달하는 엄청난 전력량입니다.2
이번 실험을 시작하게 된 계기
이렇게 AI산업이 매우 많은 전력을 사용하여 탄소배출을 하는데, 왜 당신은 AI를 활용한 작곡 프로젝트를 하고 있냐고 물으실 것 같습니다. 아주 타당하고 당연한 지적입니다. 솔직한 심정은 이 프로젝트를 진행하면서도 마음이 편치 않은 게 사실입니다.
하지만 이런 프로젝트를 진행하는 제 마음 한 편에서는 다음과 같은 생각도 있었습니다.
막대한 권력과 인력, 재력을 가진 ‘기후악당’에 맞서, 평범한 활동가들이 조금이라도 비슷하게 맞서볼 수단 중 하나가 AI라는 생각 말이죠. 예전에 인터넷이 처음 나왔을 때도 유사한 생각들이 있었던 것 같습니다. 물론 한편으론 자본의 위력을 보며 무력감과 함께 허황된 생각이란 마음이 들기도 하지만요.
여전히 따라잡을 수는 없겠지만, 그럼에도 현재까지의 결론은 『AI와 기후의 미래』 저자인 김병권 님의 제안처럼, 지구의 ‘생태적 한계’를 정하고 사용할 수만 있다면 선용하는 게 좋겠다는 생각입니다.
이 연재글을 처음부터 못 보신 분들을 위해 설명드리면, 본 프로젝트는 작년 말부터 다시 시작한 ‘월간 기후송’(시즌2) 프로젝트로, 컨셉은 ‘인간작곡 vs. AI작곡’입니다. 필자가 가사를 쓰고, 그 가사를 생성형 작곡AI인 ‘suno’를 통해 작곡하여 발표한 후, 이후 같은 가사로 필자가 직접 전통적인 방식으로 작곡을 하여, 두 곡을 비교해 투표를 받는 방식입니다. (나름 흥미로운 시도였지만 투표 참가자가 저조하여 현재 투표는 폐지).
전통방식 vs. AI방식 음원제작 전력사용량 비교
그런데 AI를 돌리면서 분명 일반적인 작업에 비해 데이터사용이 많을 거라는 생각이 들었고, 불편함과 부담감이 계속 쌓여갔습니다. 그러다 문득 내가 앨범을 만든다고 가정하고, ‘전통적인 음원제작 방식과 AI를 통한 음원제작 방식 중 어떤 것이 탄소배출을 더 많이 할까? 라는 의문이 들었고, ‘어쩌면 전통적 방식이 더 많이 할 수도 있겠다.’라는 막연한 가설을 세우게 되었습니다. 왜냐하면 전문 연주자들의 경우, 개인 악기나 장비 등이 무겁기도 하고 고가의 제품들이라 개인차량을 이용하는 경우가 많습니다. 또한 녹음 스튜디오에 PC, 콘솔 등 각종 장비들에서 열이 많이 나기 때문에 추울 때 외에는 에어컨을 트는 경우가 많고, 음원 편집작업은 밤샘작업 등으로 전기를 많이 사용할 수밖에 없는 구조이기 때문입니다.
○ ChatGPT(지피티)의 답변

그래서 결국 지피티에게 물어봤고(AI에 대한 문제를 AI에게 물어봐야 하는 아이러니한 상황이긴 하지만), 처음 나온 답은 전통방식이 AI제작방식에 비해 5천배나 탄소배출이 많다는 것이었습니다.
엥? 아무리 그래도 그럴 리가? 뭘 놓쳤을까 생각하다가 작곡 AI를 돌릴 때 보통 약 20회 정도는 돌려야 원하는 결과물이 나왔던 경험을 통해 사용횟수를 늘렸고, 최근 온실가스 저배출의 트렌드를 반영해 전통적 방식의 연주자들이 대중교통 이용 등 탄소배출을 최소로 한다고 가정하니, 약 370배 많은 것으로 결과가 나와 5천배보다 꽤 줄기는 했습니다. 물론 여전히 큰 차이이죠. 참고로 전통적 방식의 배출량은 17.01kg CO₂e3, AI방식은 0.046kg CO₂e입니다.
○ DeepSeek(딥씨크)의 답변

그럼에도 AI에 대한 의심병을 버리지 못한 저는 최근 핫하다는 중국 모델 ‘DeepSeek’(이하 딥씨크)에게 동일한 질문들을 다시 던졌습니다. 그런데 질문을 던지던 중 놓치고 있던 점을 깨달았는데, 그건 바로 AI산업의 시작인 반도체 제작 공정부터 폐기까지의 탄소배출량을 고려해야 한다는 점이었습니다. 필자의 질문에 대해 AI가 답하는 과정에서 ‘환경전과정평가(LCA, Life Cycle Assessment)4’라는 표현을 사용해 이 개념을 알게 되었고, 이후 이것을 질문의 필수항목으로 넣었습니다. 아무튼 딥씨크는 LCA 전과정의 결과값을 주며, ‘반도체 생산+학습’이 전체의 98.8%를 차지(534kg CO₂e/538kg)하고, 실제 사용(20회 생성)은 0.7%에 불과(4kg)하다며, 학습 탄소(520kg)를 100만 곡으로 분산 시 곡당 0.52kg(총계: 5.328kg)라는 결과를 내놓았습니다.
딥씨크는 대답 마지막 부분에 환경적 시사점이라며, “AI는 ‘초기 투자’ 탄소가 큽니다. 대량 생산 시에만 친환경적! GPU 수명 연장이 핵심: 1개 GPU로 10만 곡 만들면 탄소 90%↓”라면서, AI는 ‘규모의 경제’가 필수적이라고 알려줬습니다. 많은 사람이 사용하면 1인당 탄소배출량이 줄어든다는 건데. 결국 총 배출량은 그대로이기 때문에 환경에 좋아질 건 없겠다고 판단했습니다. (역시 팔은 안으로 굽을 수밖에 없는 것인가…)
참고로 필자는 숫자에 매우 약하기 때문에 이때부터 조금씩 정신이 혼미해졌고, 이내 AI를 닦달하여 탄소배출량을 일상과 연결지어 알아듣기 쉽게 해달라고 하자, 전 과정에서 배출되는 양(530톤CO₂e)은 소나무 80,000그루의 1년 흡수량과 비슷하다고 알려줬습니다. 이를 백만 명(또는 백만 곡)이 사용했을 경우의 탄소량(0.53kg CO₂e)은 휘발유차로 약 2.2km 주행했을 때나, 휴대폰 530회 충전량과 비슷하다고 합니다.
딥씨크는 전통적인 음원제작 방식은 작사/작곡, 녹음, 연주자 이동, 편집/믹싱/마스터링, 물리적/온라인 유통 등을 통해 약 101kg의 탄소를 배출한다고 알려줬습니다. 결과적으로 전통방식이 AI방식에 비해 190배(100만명 사용 기준)를 더 많이 배출한다는 결론이 나왔습니다. 지피티(370배)를 포함 여전히 AI 제작방식이 전통 방식보다는 우세하다는 것이죠. 370배에서 190배로 조금 낮아졌지만 여전히 AI가 탄소배출을 덜 한다는 것입니다.
참고로 딥씨크는 잘 알려진 바와 같이, 미국의 규제로 중국이 핵심부품을 조달받지 못하자 저비용과 소프트웨어적인 방법으로 챗지피티와 비슷한 성능으로 만들어 낸 AI기반 챗봇입니다. 특히 딥시크는 특별한 방식5을 통해 에너지 효율을 개선했고, 이는 파라미터수 대비 GPT-4에 비해 약 10배 정도 적은 탄소배출량을 기록했습니다. 그래서 앞으로 이런 방식으로 AI를 개발하면 탄소배출을 줄일 수 있을거라 예상해 볼 수 있습니다. 하지만 역사적으로 볼 때, 이건 온실가스 감축의 대안이 될 수 없습니다. 왜냐하면 효율성이 증가해 에너지사용이 줄면, 줄인 만큼 더 많은 자원과 사용이 늘어 결과적으로 에너지사용은 더 늘어나기 때문입니다. 이는 ‘제본스의 역설’이라 불리는데, 실제로 오랫동안 현실에서 검증된 이론입니다. 오늘날 에너지효율은 획기적으로 늘었지만, 에너지사용과 온실가스배출이 더 증가하고 있다는 사실이 이를 반증해 주고 있습니다.
○ Perplexity(퍼플렉시티)의 답변

조금 더 교차검증해 보고 싶은 마음에, 이번에는 마지막으로 또다른 AI 모델인 Perplexity(이하 퍼플렉시티)에게 물어보았습니다. 참고로 퍼플렉시티는 지피티에 비해 검색 기반의 답변을 제공하고, 인용한 출처를 제공한다는 것이 큰 장점이자 차이점입니다. 실제 답변에 달린 출처들을 하나씩 클릭해 들어가니 제법 신뢰할만한 리포트나 사이트를 알려줘 조금 더 신뢰가 갔습니다. 그런데 이 녀석은 이전의 답변들과 완전히 정반대의 결과를 알려주어 적잖이 당황했고, 대체 이 차이를 어떻게 받아들여야 할지 혼란스러웠습니다.
결과부터 공개하면, 전통적 방식은 23~38kg CO₂e, AI방식은 약 406~408kg CO₂e으로, 이전 결과들과 달리 AI방식이 약 10배 이상 온실가스 배출을 많이 하는 것으로 나왔습니다.
대체 어디서 이 차이가 발생했나 봤더니 ‘반도체 생산 항목’이 온실가스 배출량의 대부분을 차지하며 400kg CO₂e이나 나온 것이었습니다. 그런데 이건 퍼플렉시티에게 AI 전과정평가 단계별 온실가스 배출을 물었을 때, ‘데이터센터 구축/운영’이 전체의 85~90%라고 답한 결과와는 너무나 다른 것이라 이상했습니다. 그래서 구글 데이터센터의 총 전력 소비량이 전년(2023) 대비 17% 증가하는 등 데이터센터 전력소비가 많긴 하지만 90% 가까이는 아니라는 사실을 알려줬더니6, ‘좋은 지적입니다!’라고 바로 태세 전환을 하며, 자신의 기존 수치가 과도하게 추정되었다 시인했습니다. 실제로는 0.01~0.1kg CO₂e 이하가 더 현실적이라면서 자백한 것이지요. 그런데 사과 한 마디 없었습니다. 이런 뻔뻔한 AI같으니… 전형적인 할루시네이션7입니다.
아무튼 결론적으로, 퍼플렉시티도 전통적 방식(23~38kg CO₂e)이 AI방식(약 2.7~4.5kg CO₂e)보다 약 8배 정도 온실가스 배출을 많이 하는 것으로 계산이 되었습니다. 이로서 3가지 AI모델 모두 전통적 음원제작 방식보다 온실가스 배출을 덜 한다고 판단했습니다.
정리하면, 전통적 음원제작 방식이 AI방식에 비해 온실가스를 더 많이 배출하는데, 지피티는 370배, 딥시크는 190배, 퍼플렉시티는 8배 더 많이 한다고 정리가 되었습니다. 물론 제가 작성한 프롬프트 명령에 따른 결과이므로, 관련 전문가가 정교하게 질문한다면 충분히 다른 결과가 나올 수 있을 것입니다.
급속히 팽창하는 AI산업, 대안은?8
“자 그럼 편한 마음으로 AI 음원작업을 해볼까?”라고 하면 좋겠지만, 그럴 수가 없습니다.
앞의 글들을 읽어보셔서 아시겠지만, 앞으로 펼쳐질 AI산업의 미래는 거의 이 세상 모든 전기를 다 빨아들일 태세로 보이기 때문입니다. 그래서 해외의 대응방안을 살펴볼 필요가 있습니다.
동남아시아 전체 데이터 센터 용량의 60%를 차지하는 싱가폴은 2019년부터 새로운 데이터센터 건설을 잠정 중단하는 ‘모라토리엄’을 선언했습니다. 2023년 모라토리움 해제 이후에도, 추가될 데이터 센터 용량 중 2/3는 친환경 에너지 옵션을 사용하는 운영업체들에게만 할당하겠다고 했습니다.
유럽에서 가장 큰 데이터센터(연간 약 20TWh 수준 전력소비)를 보유한 독일은, 2023년 에너지 효율법(German Energy Efficiency Act, EnEfG)이 발효되어 2030년까지 연방 차원에서 연간 45TWh 감축, 각 주에서 연간 3TWh 감축하도록 되어 있습니다. 데이터센터 규제도 포함하고 있는데, 300kW 이상인 모든 민간 및 공공 소유 데이터센터에 적용된다고 합니다.
세계에서 가장 데이터센터 비중이 높은 아일랜드의 경우, 남은 탄소 예산이 데이터센터 개발에 대한 기존의 모든 수요를 수용할 수 없음을 정부는 인정했습니다.
정부는 기후대응과 디지털 경제의 발전을 조화시키기 위한 ‘지속가능한 데이터센터 원칙’ 6가지를 정하고, “탈탄소화와 함께 경제의 디지털화를 진행하면서 디지털 인프라의 막대한 에너지 수요를 수용할 수 있는 능력과 적절한 균형을 맞추는 것”이라고 설명했습니다. 특히 환경부 장관의 “우리의 디지털 사용은 우리가 정한 생태적 한계 안에 있다”는 말은 인상적입니다.
마무리 & 제안
필자는 현재 AI를 활용한 작곡을, AI에게 온전히 맡기는 방식은 가급적 사용하지 않고, 필자가 만든 음원 초안을 ‘커버’ 기능을 사용하여 AI에게 약간의 편곡과 함께 음원작업화(믹싱+마스터링) 하는 방식으로 활용하고 있습니다. 그렇기에 원하는 곡이 나올 때 까지 계속 AI를 돌리며 전력을 낭비하는 방식은 어느 정도 피할 수 있습니다.
그래서 AI로 음악작업을 하시려는 분들은 저처럼 본인이 작곡한 음원을 ‘커버’ 기능을 통해 음원작업화 하시면 어떨까 싶습니다. 그래야 AI에게 온전히 의존하지 않으면서도, 개인이 감당하기에는 비용과 시간 면에서 부담이 큰 전통적 음원제작 방식을 사용하지 않고서도 작업이 가능하니까요. 물론 본인이 통제할 수 없는 약간의 변화(편곡)는 감당해야 하겠지만요.
아마도 AI가 그럴듯한 곡을 뚝딱 만들어주는 것이 신기하여 재미삼아 하시는 분들도 적지 않을거라 생각이 됩니다. 물론 유료 사용자가 아니면 일일 사용량 제한이 있기는 하지만…
그래서 AI산업부터 일상생활의 사용에 이르기까지 적정한 생태적 한계 기준을 만드는 것이 필요하다는 생각이 듭니다. 돈을 지불하는 방식은 디지털 불평등을 심화시킬 수 있어 신중한 접근이 필요하고, 데이터 총량제 방식도 섬세한 접근이 필요할 것 같습니다. 분명한 원칙을 세우고, 의지를 가지고 연구하면 분명 바람직한 방안이 마련될 거라 생각합니다. 그래야 많은 사람들이 조금은 편한 마음으로 가치있고 생산적인 일에도 AI를 사용할 수 있지 않을까 싶습니다.
기술을 너무 의존하는 것도, 또 배척하는 것도 바람직한 태도는 아닐 텐데요. 그럼에도 자본은 자주 기술을 통해 지배력을 확장해 왔기에 경계를 늦춰서는 안 될 것입니다. 이 둘 사이에서 긴장을 놓지 않아야겠습니다. 골치 아픈 일이지만 그래야겠습니다. 월간 기후송도 그 사이 어딘가에서 길을 만들어 보겠습니다.
참고자료 (AI 모델별 분석표)
앞서 설명한 작업들을 표로 만든 것인데요, 총괄적으로 질문을 하다 보니 각 모델별로 답이 달라 일관된 항목으로 작업하지 못했습니다. 가볍게 참고만 해주세요.
● ChatGPT (챗지피티): 1곡 제작 시 전체 수명 주기(LCA) 탄소배출량 비교 (단위: kg CO₂e)
단계 | 세부 항목 | 전통적 방식 | AI 기반 방식 (Suno) |
1. 자원 추출 및 장비 생산 | 악기, 마이크, 오디오 장비 | 3.0 | – |
AI 칩(GPU, TPU 등), 서버 | – | 15.0 | |
2. 인프라 구축 및 유지 | 녹음 스튜디오 건물, 냉난방 | 2.5 | – |
데이터센터 건설 및 유지 | – | 6.0 | |
3. 에너지 사용 (제작) | 녹음·편집·마스터링 전기 사용 | 6.0 | 8.0 |
AI 추론 수행 (20회 기준) | – | 8.0 | |
4. 이동 및 물류 | 연주자·스태프 이동 (대중교통 기준) | 1.2 | 0.5 |
5. 배포 및 소비 | 디지털 배포 | 0.5 | 0.5 |
6. 모델 훈련(1곡 환산) | 해당 없음 | – | 40.0 |
7. 폐기 처리 | 장비 및 CD의 폐기·재활용 | 1.0 | – |
반도체·서버의 전자폐기물 처리 | – | 4.0 | |
총합 | 14.2 | 81.0 |
● Deepseek(딥시크): 전과정(LCA) 세분화 표
단계 | 전력 소모 (kWh) | 탄소 배출량 (kg CO₂e) | 주요 원인 |
1. 반도체 생산 | 30.0 | 12.0 | GPU 1개 제조 (NVIDIA H100 기준) |
2. 데이터센터 건설 | 5.0 | 2.0 | 서버 랙·냉각 인프라 |
3. 모델 학습 | 1,300.0 | 520.0 | Suno 모델 초기 학습 (곡당 분담) |
4. AI 음원 생성 (20회) | 10.0 | 4.0 | 20회 GPU 사용 (0.5 kWh/회) |
5. 온라인 유통 | 0.02 | 0.008 | 스트리밍 전송 |
6. 장비 폐기 | 2.0 | 0.8 | GPU 재활용/처리 에너지 |
총계 | 1,347.02 | 538.808 |
● Perplexity(퍼플렉시티)
단계 | 전통적 방식 (1곡 제작) | AI 방식 (Suno, 20회 제작) | 산정 근거 및 설명 |
작사·작곡 | 2~4kg CO₂e | AI 모델 학습: 0.01kg CO₂e (1인당) | AI 학습은 전체 배출량을 사용자·생성횟수로 분산 시 미미함 |
녹음 스튜디오 | 6~10kg CO₂e | – | |
연주자 이동 | 10~15kg CO₂e | – | |
편집·믹싱·마스터링 | 4~8kg CO₂e | – | |
CD·앨범 제작 | 0.3~0.5kg CO₂e | – | |
케이스·인쇄물 | 0.15~0.3kg CO₂e | – | |
포장·운송 | 0.05~0.1kg CO₂e | – | |
데이터센터 구축(1인당) | – | 0.05kg CO₂e | 최신 LCA 기준, 데이터센터 인프라 구축 전체를 사용자 단위로 분산 시 미미함 |
데이터센터 운영·냉각 | – | 2~4kg CO₂e (20회 기준) | 1회당 약 0.1~0.2kg CO₂e, 냉각 포함. 실제 전력·PUE·전력믹스에 따라 변동 |
Suno 프로그램 실제 사용 | – | 2~4kg CO₂e (20회 기준) | Suno 1회 동작 전력(서버+냉각) × 20회 × 탄소계수(0.4kg CO₂e/kWh) |
총합 | 23~38kg CO₂e | 4~8kg CO₂e (수정) 약 2.7~4.5kg | AI 방식은 데이터센터 운영·냉각이 절대적 비중, 인프라 구축·AI 학습은 1인당 환산 시 미미한 수준 |
이산화탄소환산량: ‘CO₂e’(carbon dioxide equivalent, CO₂eq라고도 함). Eurostat에서 공식적으로 정의한 ‘CO₂e’는 다양한 온실가스의 배출량을 등가의 이산화탄소(CO2)양으로 환산한 것으로, 지구온난화지수(GWP)를 기준으로 다양한 온실가스의 배출량을 비교하기 위한 지표. 지구온난화에 각기 다른 영향을 주는 다양한 온실가스들을 계산하기 편하게 하기 위해 이산화탄소량으로 환산한 것. ↩
LCA(Life Cycle Assessment)는 제품 및 서비스의 원료 채취부터 제조, 유통, 사용 및 폐기에 이르기까지 전과정에 걸친 환경 영향을 정량적으로 분석・평가하는 방법 ↩
“입력 질문의 여러 요소 간의 문맥 관계를 훨씬 더 효율적으로 처리하는 혁신적인 접근 방식을 사용하여 질문의 가장 중요한 단어에만 집중하고 나머지는 덜 신경 씀. 또한 출력 단어를 순차적으로 계산하지 않고 병렬로 계산. 그 결과 성능대비 온실가스 배출량도 줄일 수 있었음.”「AI팽창 속에서 가속화되는 기후위기」, 강의자료 31번 슬라이드, 김병권 『AI와 기후의 미래』 저자. ↩
hallucination(환각): 환각은 모델이 정확하지 않거나 무의미한 정보를 자신 있게 생성할 때 발생하는데, 학습을 기반으로 그럴듯한 응답을 만들려고 할 때, 모델은 합리적인 응답을 만들긴 하지만 실제로는 사실이나 논리적 일관성과는 거리가 없는 답변을 표출하는 것이다(위키백과). ↩
「AI팽창 속에서 가속화되는 기후위기」, 강의자료 31~38번 슬라이드, 김병권 『AI와 기후의 미래』 저자 ↩