A interrupção da Amazon Web Services (AWS) ocorrida na segunda-feira (20) provocou uma cascata de problemas que afetou alguns dos sites e aplicativos mais populares da internet. A falha, que começou nas primeiras horas da manhã, expôs a dependência crítica que milhões de empresas e usuários têm da infraestrutura em nuvem fornecida pela gigante da tecnologia.
Como líder no mercado de computação em nuvem, controlando aproximadamente um terço de todo o setor, a AWS sustenta operações essenciais de inúmeras organizações ao redor do mundo.
O incidente teve início às 3h11 (horário do leste dos EUA) na principal região US-East-1 da empresa, localizada no norte da Virgínia. Rapidamente, os efeitos da interrupção se espalharam, deixando milhares de usuários sem acesso a serviços essenciais.
A plataforma Downdetector registrou um volume expressivo de reclamações relacionadas a problemas em sites como Amazon (AMZN; AMZO34), Snapchat, Disney+, Reddit e Canva, evidenciando a amplitude do colapso.
Origem técnica do problema e esforços de recuperação
A causa raiz da interrupção da Amazon Web Services estava relacionada a problemas no Sistema de Nomes de Domínio (DNS) que afetaram o DynamoDB, o serviço de banco de dados fundamental da AWS. O DNS funciona como uma espécie de “catálogo telefônico” da internet, traduzindo nomes de sites legíveis por humanos em endereços IP numéricos que os computadores utilizam para localizar e carregar páginas web. Quando esse sistema falha, mesmo que os dados estejam intactos, os aplicativos simplesmente não conseguem encontrá-los.
Conforme explicou Mike Chapple, professor de TI da Universidade de Notre Dame e ex-cientista da computação da Agência de Segurança Nacional (NSA): “DynamoDB não é um termo que a maioria dos consumidores conheça. No entanto, é um dos guardiões dos registros da internet moderna.” Ele acrescentou que “os primeiros relatos indicam que o problema não era exatamente com o banco de dados em si. Os dados parecem estar seguros. Em vez disso, algo deu errado com os registros que informam a outros sistemas onde encontrar seus dados.”
A Amazon Web Services classificou o incidente como um “problema operacional” que impactou mais de 70 de seus próprios serviços. Em atualizações constantes ao longo do dia, a empresa informou que estava “trabalhando em vários caminhos paralelos para acelerar a recuperação”.
Às 6h35 (horário do leste dos EUA), a AWS anunciou que o problema de DNS havia sido “totalmente mitigado” e que as operações estavam “funcionando normalmente”. No entanto, usuários continuaram relatando dificuldades, com novo pico de reclamações registrado por volta do meio-dia.
Impacto generalizado em empresas e consumidores
A extensão da interrupção da Amazon Web Services foi sentida em múltiplos setores da economia digital. Grandes plataformas de entretenimento como Disney+ e Snapchat enfrentaram instabilidade, enquanto serviços financeiros como Robinhood e Venmo também reportaram problemas. Até mesmo companhias aéreas como United Airlines e Delta viram clientes relatando nas redes sociais que não conseguiam encontrar suas reservas online, fazer check-in ou despachar bagagens.
O setor educacional também foi atingido. A Canvas, uma plataforma de ensino online amplamente utilizada para hospedar informações de cursos e enviar tarefas, confirmou que foi afetada pelo “incidente em andamento da AWS”. Jogos populares baseados em nuvem, incluindo Roblox e Fortnite, apresentaram problemas de conectividade, frustrando milhões de jogadores ao redor do mundo.
Internacionalmente, o impacto também foi significativo. Os sites do governo britânico Gov.uk e HM Revenue and Customs enfrentaram dificuldades de acesso. Um porta-voz do governo britânico declarou à CNBC: “Estamos cientes de um incidente que afetou a Amazon Web Services e diversos serviços online que dependem de sua infraestrutura. Por meio de nossos acordos de resposta a incidentes, estamos em contato com a empresa, que está trabalhando para restaurar os serviços o mais rápido possível.”
O Lloyds Banking Group, importante instituição financeira britânica, também confirmou problemas em seus serviços, embora tenha conseguido restabelecê-los em cerca de 20 minutos.
Consequências internas na própria Amazon
Ironicamente, a interrupção não poupou nem mesmo as operações internas da Amazon. Funcionários de depósitos e serviços de entrega, além de motoristas do programa Flex da Amazon, relataram no Reddit que sistemas críticos estavam fora do ar em diversos locais. Alguns trabalhadores de armazéns foram instruídos a permanecer de prontidão em salas de descanso e áreas de carga durante seus turnos, incapazes de acessar ferramentas essenciais para o trabalho.
O aplicativo Anytime Pay, que permite aos funcionários acessar uma parte de seu salário imediatamente, também ficou inacessível, causando transtornos adicionais. O Seller Central, plataforma crucial utilizada por vendedores terceirizados para gerenciar seus negócios na Amazon, igualmente saiu do ar, impactando milhares de pequenas e médias empresas que dependem do marketplace.
A Amazon confirmou oficialmente que a interrupção afetou não apenas a Amazon.com e algumas de suas subsidiárias, mas também as próprias operações de suporte ao cliente da AWS. Em comunicado, a empresa afirmou: “Estamos trabalhando para restaurar totalmente o serviço o mais rápido possível.”
A fragilidade da infraestrutura digital centralizada
Este episódio serve como um alerta contundente sobre a concentração da infraestrutura digital global nas mãos de poucos gigantes tecnológicos. A AWS, juntamente com Microsoft Azure e Google Cloud, domina o mercado de computação em nuvem. Quando um desses provedores principais enfrenta problemas, o efeito dominó pode ser devastador para a economia digital mundial.
Rob Jardin, diretor digital da empresa de segurança cibernética NymVPN, avaliou que a interrupção não parece ter sido causada por um ataque cibernético, mas sim por uma “falha técnica que afetou um dos principais data centers da Amazon”. Ele explicou: “Esses problemas podem ocorrer quando os sistemas ficam sobrecarregados ou uma parte importante da rede cai e, como muitos sites e aplicativos dependem da AWS, o impacto se espalha rapidamente.”
Mike Chapple resumiu a situação de forma eloquente, “Este episódio serve como um lembrete de como o mundo depende de um punhado de grandes provedores de serviços de nuvem: Amazon, Microsoft e Google. Quando um grande provedor de nuvem espirra, a internet pega um resfriado.”
Histórico de interrupções e a competição no setor
Esta não é a primeira vez que a AWS enfrenta problemas significativos. Uma interrupção em 2023 deixou muitos sites fora do ar por várias horas, enquanto um incidente mais grave em 2021 afetou sites e serviços globalmente, incluindo operações de entrega da própria Amazon que foram brevemente paralisadas.
Esses episódios recorrentes levantam questões sobre a resiliência e redundância dos sistemas de infraestrutura em nuvem.
A competição acirrada entre Amazon, Microsoft e Google pelo domínio do mercado corporativo de nuvem tem levado essas empresas a usar as falhas umas das outras como oportunidade de marketing. Após uma interrupção do pacote de software de produtividade da Microsoft no início do mês anterior ao incidente da AWS, o Google aproveitou para promover suas próprias ferramentas, lançando um plano de continuidade de negócios que executa seu serviço Workspace em paralelo com o Microsoft 365.
Em postagem de blog provocativa, o Google escreveu: “Só porque o Microsoft 365 está fora do ar — e é uma questão de quando e por quanto tempo, não se — não significa que suas equipes precisam voltar a usar caneta e papel.” Ironicamente, os próprios serviços de nuvem do Google ficaram inativos por um período prolongado em junho, interrompendo provedores importantes como OpenAI e Shopify, devido a múltiplas camadas de atualizações com falhas.