인공지능(AI)에 대한 붐은 그 어느 때보다도 증가하고 있습니다. 그러나 이에 대한 지속 가능성에는 어떠한 영향이 있을까요?
2023년 11월 1일
7분 소요
"11월 5일을 잊지 마세요"
저는 영국에서 자란 사람으로서, 이맘때쯤이면 가이 포스크(Guy Fawkes)의 런던 테러 시도 사건을 묘사한 유명한 어린이 시의 한 구절이 떠오릅니다. 다시 설명드리면, "11월 30일을 꼭 기억해주세요" 라고 제안해 드리고 싶습니다. 이에 대해 의문이 있으실 수 있지만, 제 이야기를 좀더 들어봐 주세요.
바이에른 대공 알버트 4세는 1487년 11월 30일에 맥주는 물, 맥아, 홉의 세 가지 원료로만 주조해야 한다는 독일 맥주 순수령(라인하이츠게보트)을 뮌헨에서 최초로 공포했습니다.
최초의 국제 축구 경기는 1872년에 이와 동일한 날짜에 글래스고에서 스코틀랜드와 잉글랜드 간에 열렸으며 0:0 무승부로 끝났습니다.
1928년 호주 크리켓의 전설인 도날드 브래드먼 경은 형편없는 테스트 데뷔전을 치렀습니다. 그는 브리즈번에서 열린 애쉬스 테스트의 첫 번째 경기에서 잉글랜드와 대결해 18 및 1점을 기록했으며 이후 테스트 매치에서 12위로 떨어졌습니다. 브래드먼 경은 80회의 테스트 매치 이닝 동안 평균 99.84점을 기록했으며 이는 결코 견줄 수 없는 위업입니다.
이제 제가 맥주, 축구, 크리켓을 좋아하는 것이 AI와 지속가능성이라는 주제와 무슨 관련이 있는지 궁금하실 것입니다.
Open AI가 ChatGPT를 세상에 공개한 2022년 11월 30일을 떠올려 보세요. 가이 포크스 자신은 테러 이후 우리가 지금까지 목격한 전 세계적인 변화와 이로 인해 일상 생활에 미친 큰 영향을 자랑스러워 했을 것입니다.
지속가능성은 최근 빠르게 부각되고 있는 또 다른 주제입니다. 오늘날에는 여러 다양한 정보 소스를 이용할 수 있고, 어떤 정보는 다른 정보보다 더 신뢰할 수 있기 때문에 저는 종종 편향되지 않은 시각을 얻기 위해 젊은이들의 순수함을 바라봅니다. 얼마 전까지만 해도 저는 제 아이들에게 사용하지 않는 전등과 전기 장치를 끄라고 말하곤 했습니다. 하지만 이제 전세가 역전되어 제가 분리배출을 잘못하면 아이들이 바로 지적합니다. 재활용을 실천하면 새로운 상품의 생산 및 이동에 에너지를 적게 사용하므로 이산화탄소 배출량이 줄어듭니다. 제 아이들이 자주 말하듯이, 우리가 재사용하고 수리하고 재활용을 할 때마다 지구를 구하는 데 도움이 되는 작은 역할을 하고 있는 것입니다!
그렇다면 탄소 배출량을 줄이기 위해 우리가 할 수 있는 다른 일에는 무엇이 있을까요?
지속가능성 정책은 오늘날 대부분의 기업에서 일반적이며, 기업의 ESG 이니셔티브를 측정하고 보고하여 지원하는 데 사용할 수 있는 다양한 도구, 리소스 및 프레임워크가 제공됩니다. 뿐만 아니라 조직에 대한 투명성과 이해도를 높이고 브랜드 인지도를 강화하기 위해 지속가능성 이니셔티브와 관련된 콘텐츠를 게시하는 기업들이 점차 증가하고 있는 추세입니다. 유명한 기술 기업인 애플(Apple)은 최근에 환경 목표에 대한 진보를 전세계에 업데이트하는 정교한 동영상을 제작했습니다. 이 동영상은 업로드된 지 하루 만에 이전에 트위터(Twitter)라고 불렀던 플랫폼 "X"에서 50만 건 이상의 조회수를 기록했습니다.
재생 가능 에너지로 전환하고 사용량을 줄이는 것은 탄소 배출을 줄이는 첫 번째 중요한 단계이지만, 이를 효과적으로 수행하려면 먼저 현재 사용량을 파악하고 목표를 설정하며 진행 상황을 측정할 수 있어야 합니다. 다이어트라고 생각해 보세요. 처음에 몸무게가 얼마나 나가는지 또는 매일 얼마의 칼로리를 소비하는지 알지 못하면 목표를 달성할 가능성이 거의 없습니다.
저는 최근에 번역회사협회(ATC)가 주최한 윤리적 비즈니스 서밋에서 있었던 댈러스 컨설팅(Dallas Consulting)의 기조 연설에서 가져온 “완벽이 아닌 진보”라는 말에 가장 공감했습니다. 완벽을 위한 노력은 궁극적으로 실패로 끝나지만, 작은 목표와 중요한 단계의 성취가 쌓이면 상당한 차이를 만들어 낼 것입니다.
상당한 영향을 미칠 수 있는 한 가지 변화는 탄소 중립에 초점을 맞춘 책임 있는 공급자를 사용하여 소프트웨어 플랫폼을 퍼블릭 클라우드로 전환하는 것을 고려하는 것입니다. 클라우드 공급자는 본질적으로 더 효율적입니다. 결국, 효율성은 수익성에 직접적인 영향을 미치기 때문에 첨단 기술에 투자하고 모니터링을 통해 하드웨어의 효율적인 사용을 확인하고 용량을 최적화하는 것이 클라우드 공급자의 관심사입니다. 통계에 따르면 랙에 장착된 서버 중 20%가 완전히 활용되지 않거나 심지어는 전혀 사용되지 않고 있는 것으로 나타났습니다. 아웃소싱 비용인 클라우드 환경은 조달 팀에서 지속적으로 철저히 검토하지만 자체 호스팅되고 관리되는 서버는 범위에 들지 않는 경향이 있습니다.
AI는 지속가능성 이니셔티브에 어떻게 적합한가요?
최근에 AI가 급격히 인기를 얻었다고 말하는 것은 아주 절제된 표현이라고 할 수 있습니다. AI의 잠재력에는 경계가 없으며 많은 사람들이 이미 혜택을 보고 사용하고 있지만, 지속가능성 측면에서 즉각적으로 눈에 띄지 않을 수도 있는 숨은 비용이 있다는 사실을 알고 있어야 합니다.
대규모 언어 모델(LLM) 교육에는 엄청난 연산 능력이 필요합니다. GPT-3의 교육으로 인해 약 500톤의 이산화탄소가 배출되는 것으로 추정됩니다. 이는 일반 가솔린 차량으로 140만 마일을 주행하거나 6,700만 대의 스마트폰을 충전하는 것과 같습니다.
현재 AI와 LLM을 인기 검색 엔진에 통합하는 것에 대한 많은 이야기가 있습니다. 생성형 AI를 추가하면 모든 검색에 4~5배 더 많은 연산 능력이 필요할 것으로 예상됩니다. 현재 ChatGPT는 매일 약 1,300만 명이 사용하고 있고 일반적인 주류 검색 엔진은 매일 5억 건의 검색을 처리합니다!
또한 AI 모델을 생성하는 데 필요한 하드웨어도 고려해야 합니다. 가장 잘 알려진 생성형 AI 모델은 그래픽 처리 장치(GPU)가 있는 수천 대의 서버를 필요로 하는 초대규모 공급자에 의해 처리됩니다. GPU는 또한 암호화폐 채굴 및 머신 러닝의 등장 이후 새로운 사용 목적을 가지게 되어 수요가 일정 기간 동안 생산 능력을 뛰어넘었습니다. GPU는 대규모 데이터 세트를 처리하고 복잡한 알고리즘을 보다 효율적이고 병렬적으로 운영할 수 있기 때문에 머신 러닝에 매우 적합하지만 GPU에 전력을 공급하는 데 필요한 에너지에는 적정성이 있습니다.
현재 데이터센터는 전 세계적으로 온실가스 배출량의 약 1~3%를 차지하고 있지만, 이를 일반적인 검색 엔진과 통합하기 때문에 생성형 AI의 수요 증가에 대처하지 못할 것이라고 예측하고 있습니다.
우리는 새로운 데이터센터를 구축하는 데 있어 사고방식의 변화와 추진력의 이동이 점점 더 커지는 것을 보기 시작했습니다. 예를 들어, ATC 윤리적 비즈니스 서밋에서 유럽연합 집행기관의 번역 사무국장인 크리스토스 엘리니드는 유럽 전역의 슈퍼컴퓨터를 호스팅하기 위해 9개의 데이터센터가 설치되고 있으며 대부분 녹색 에너지로 운영되고 있다고 언급했습니다. 예를 들어, 룩셈부르크에 구축된 데이터센터는 폐목재에서 생산된 100% 친환경 에너지를 사용하여 슈퍼컴퓨터를 냉각시키고 전원을 공급합니다.
AI는 왜 이렇게 많은 처리 전력을 사용하나요?
생성형 AI 모델의 초기 교육은 프로세스에서 가장 집중적인 부분입니다. 단일 LLM 교육은 대서양 횡단 여객기와 동일한 에너지를 사용하고 탄소를 배출시킵니다. 일단 교육이 완료되면 해당 모델에서 사용자 프롬프트에 대한 응답을 얻기 위해 각 세션에서 필요한 에너지는 줄어들지만 세션 수는 계속 증가합니다.
또한 이 분야의 선두가 되기 위해 조직들이 경쟁하면서 LLM의 오픈 소스 모델 수가 급증하는 것도 볼 수 있습니다. 이 오픈 소스 분야는 혁신으로 가득 차 있으며 다양한 모델이 제시되어 더 많은 사람들이 이용할 수 있도록 합니다. 그러나 지속가능성 측면에서 보면 이 때문에 더 많은 조직이 자체 모델을 만들거나 미세 조정하기 위해 노력하고 결과적으로 에너지 수요가 증가하게 됩니다. 이러한 경향의 분산화된 특성은 이러한 책임이 소수의 기업에만 있지 않다는 것을 의미합니다. 따라서 탄소 배출량을 줄이기 위한 모든 조치와 이니셔티브에는 더 많은 조직이 접근할 수 있어야 합니다.
LLM 전략을 정의할 때 최상의 접근법을 이해하기 위한 많은 연구가 진행 중입니다. 우리는 최적의 규모란 무엇이며, LLM을 처음부터 구축하는 것이 좋은지, 아니면 상용 모델을 사용하는 것이 더 나은지에 대해 질문하기 시작했습니다. 저는 몇 년 전에 번역 메모리가 처음 두각을 나타냈을 때 언어 업계가 겪었던 상황과 유사한 부분을 발견했습니다. 당시 업계 전문가들은 자신의 TM 전략을 완성하기 위한 완벽한 방법을 찾고 있었습니다. TM, 용어집, 기계 번역과 같은 기존 번역 리소스를 보완, 교육 및 향상시키기 위한 생성형 AI의 잠재력을 활용할 수 있기 때문에 LLM의 시작은 이러한 논의의 장을 한 번 더 엽니다.
AI 기술 기업들은 이 상황을 개선하기 위해 무엇을 할 수 있을까요?
새로운 데이터를 처리하는 데 필요한 연산 성능의 양을 줄이는 방법을 이해하기 위한 연구가 진행 중입니다. 그러나 이미 분명한 것은 새로운 LLM을 만드는 것보다 기존 LLM을 세밀히 조정하거나 전문 교육을 제공하는 것이 더 저렴하다는 것입니다.
또한, ESG가 과도하게 치우쳐져 있다는 일부 비평가들의 고려할만한 반론도 있습니다. 이는 결과적으로 ESG 관행을 미덕으로 채택한 조직 내에서, 때로는 비즈니스 초점과 기술 발전을 희생하는 과도한 집착을 낳았습니다.
우리는 가치와 정확도 사이에서 적절한 균형을 찾아야 합니다. 모델의 정확도를 1~2% 향상시키는 데 드는 비용이 미터톤 단위의 온실 가스로 측정된다면 이로 인한 이득을 정당화할 수 있는지 의문을 가져야 합니다. 특정 도메인과 일부 콘텐츠 스트림에서는 정확도의 1~2%를 추가로 확보하는 것이 매우 중요할 수 있지만, 다른 경우에는 그 이점이 미미할 수 있습니다.
로컬라이제이션 전문가는 어떤가요? 그들이 무엇을 할 수 있나요?
적절한 공급자를 선택하는 것은 프로세스의 첫 번째 단계입니다. 많은 데이터센터가 탄소 배출량을 줄이기 위해 최선을 다하고 있지만 이러한 책임을 유지하도록 하는 것은 우리에게 달려있습니다. 트라도스 엔터프라이즈는 AWS를 사용하여 호스팅합니다. AWS는 2030년까지 100% 재생 가능 에너지로 전력을 공급하기 위해 노력하고 있으며, 현재 2025년까지 이 목표를 달성할 것으로 예상되고 있습니다. 또한 AWS는 2040년까지 탄소 배출량을 넷 제로(net zero)로 만드는 것을 목표로 합니다.
또한, 책임 있는 공급자와 협력하면 자체 탄소 저감 목표를 달성하는 데 도움이 되므로 이 요소를 선택 기준의 일부로 포함시키는 것이 중요합니다. 퍼블릭 클라우드로 이전할 수 없는 경우 자체 관리 서버보다 책임 있는 데이터센터를 고려하세요.
AI는 우리가 살고 있는 세상을 변화시키고 있으며, 저는 누구도 그 여정에 동참하는 것을 막지 않을 것입니다. 그러나 우리 모두가 할 수 있는 일은 AI를 책임감 있게 사용하고 우리의 선택에 따른 환경적 영향을 염두에 두는 것입니다.
AI 혁신을 활용하되, 이를 통해 진정한 가치가 실현되도록 해야 합니다. 시장은 AI 기능으로 가득 차고 있으며 모두가 차선책이라고 주장합니다. 이는 우리가 AI에서 본 속도와 추진력으로 무언가가 성장할 때 피할 수 없는 불행한 부작용입니다. 새 기능을 평가할 때 자신에게 질문해 보세요.
- 이 기능을 통해 비용을 절감할 수 있을까요?
- 이 기능으로 품질 향상이 촉진될까요?
- 이 기능으로 효율성이 향상될까요?
만약 이 모든 질문에 대한 답이 “아니요”일 경우, 11월 5일이 되면 이 기능이 거의 확실히 폐기되어 사라질 것이라고 말하고 싶습니다.