Na era digital, a interrupção de serviços de internet, conhecida como "Internet Outages", é uma realidade com a qual todas as empresas de tecnologia precisam lidar. Mesmo as maiores e mais robustas infraestruturas de rede não estão imunes a esses eventos. A XLabs Security, como uma empresa de CDN e WAF, entende que esses incidentes são parte da natureza dinâmica e sempre em evolução da tecnologia.
Para ilustrar, vamos explorar alguns exemplos de interrupções de rede significativas que ocorreram na última década, conforme listado no site PCIChecklist, organizados em ordem cronológica:
-
Vodafone Data Centre (2011): A Vodafone aprendeu da maneira mais difícil a importância da segurança física quando ladrões invadiram seu data center em Hampshire, causando interrupções significativas no serviço.
-
Ataque cibernético Dyn (2016): Um ataque de negação de serviço distribuído (DDoS) direcionado aos serviços DNS da Dyn tornou inacessíveis grandes plataformas e serviços de internet para consumidores na Europa e América do Norte.
-
Deutsche Telekom (2016): As falhas de rede afetaram centenas de milhares de usuários da Deutsche Telekom na Alemanha, aparentemente ligadas a uma tentativa frustrada de transformar um grande número de roteadores de clientes em parte do botnet Mirai.
-
Amazon Web Services (2017): Uma grande interrupção no AWS S3 causou interrupções parciais ou completas em vários sites populares, aplicativos e dispositivos.
-
British Airways IT Failure (2018): Devido a um problema com seus sistemas de check-in, a British Airways foi forçada a cancelar mais de 100 voos, causando atrasos em mais de 200 aeronaves nos principais aeroportos da Grã-Bretanha.
-
Microsoft Azure (2018): Durante o verão mais quente já registrado nos países nórdicos, a Microsoft Azure sofreu uma interrupção quando a temperatura atingiu 18°C na região da Irlanda, causando uma crise de água para os locais e deixando a Microsoft sem refrigeração suficiente para manter seus recursos do data center de Dublin operando em temperaturas ótimas.
-
Google Cloud (2018): Cerca de 87% dos clientes tiveram problemas no App Engine, HTTPS Load Balancer ou soluções TCP/SSL Proxy Load Balancer durante a interrupção, que durou cerca de 30 minutos.
-
O2 Outage (2018): A interrupção, que começou nas primeiras horas de 6 de dezembro, deixou 30 milhões de clientes sem acesso à internet. A interrupção durou o dia todo e foi causada por uma falha no equipamento de rede Ericsson que atendia a vários operadores em todo o mundo.
-
CenturyLink (2018): A interrupção da CenturyLink, que foi a interrupção de rede mais significativa de 2018, impediu que milhões de usuários ligassem para o 911, fizessem saques em caixas eletrônicos, acessassem registros de saúde de pacientes sensíveis, utilizassem serviços de banda larga móvel da Verizon ou até mesmo participassem de sorteios de loteria.
-
Amazon Web Services (2021): Em dezembro de 2021, uma falha na AWS deixou vários sites e serviços fora do ar, como relatado pelo Olhar Digital e Tecnoblog.
Esses exemplos demonstram que as interrupções de rede podem ocorrer em qualquer lugar, a qualquer momento, e por uma variedade de razões. No entanto, é importante notar que essas interrupções, embora significativas, são a exceção e não a regra. As empresas de tecnologia, incluindo a XLabs Security, trabalham incansavelmente para garantir a resiliência e a confiabilidade de suas redes.
A XLabs Security também experimentou interrupções. Em 7 de dezembro de 2020, tivemos um problema em nosso Data Center da IBM em São Paulo, conforme relatado por nós ao CISO Advisor. O problema foi causado por problemas de resfriamento no início da temporada de verão no Brasil, um problema semelhante ao enfrentado pela Microsoft Azure em 2018. Após esses incidentes, foram promovidas melhorias e redundâncias para evitar a repetição de tais problemas.
Mais recentemente, em 8 de novembro de 2022, tivemos uma interrupção causada por uma atualização de DNS que foi enviada de forma errada para os servidores raízes de nossos domínios. Este incidente foi detectado em minutos e resolvido em algumas horas, semelhante ao problema enfrentado pelo Facebook e WhatsApp em 4 de outubro de 2021, como demonstrado neste artigo, também em 2023, em Junho outro problema de DNS causou a queda do WhatsApp como podemos ver neste artigo.
Além disso, é importante mencionar que a transparência é um valor fundamental para a XLabs Security. Ao contrário de outras empresas, como a AWS, que nem sempre são transparentes com seus clientes quando ocorrem interrupções, vendendo um serviço considerado comercialmente "a prova de falhas" que leva muitos técnicos e analistas a acreditarem fielmente que esses grandes players não possuem problemas de outages, levando-os a erros e pré-conceitos em suas análises, a XLabs Security se compromete a manter seus clientes informados, mesmo quando as notícias não são boas. Por exemplo, em junho de 2023, a AWS enfrentou uma instabilidade, conforme relatado pelo TechTudo onde ao acessarmos os painéis de status da plataforma, demonstravam que todos os sistemas estavam operacionais, algo que estava fora da realidade que estava ocorrendo no momento, por isso plataformas colaborativas são ótimas auxiliares na detecção de falhas e outages, uma das plataformas que podemos citar é o caiutudo.com.
Ferramentas colaborativas (ou não) para identificar e analisar outages:
Outages mundiais: https://www.thousandeyes.com/outages/
Outages nos EUA: https://downdetector.com/
Outages no Brasil: https://downdetector.com.br/
App para Android Speedtest da Ookla: https://play.google.com/store/apps/details?id=org.zwanoo.android.speedtest
Além disso, concorrentes da XLabs Security, como a Cloudflare, também enfrentaram interrupções significativas seguidas, vendendo comercialmente "um sistema a prova de falhas", conforme relatado pelo ZDNet, Tecnoblog e TechTudo.
A XLabs Security acredita na importância de aprender com esses incidentes e trabalhar para melhorar continuamente nossos sistemas e processos. Nossos outages foram em tempos diferentes e não são seguidos, provemos um serviço de qualidade que pode ser constatado em nosso SLA que pode ser encontrado em status.xlabs.com.br onde na data de hoje está entorno de 99.97% de SLA nos últimos 90 dias.
Em conclusão, embora as interrupções de rede sejam inevitáveis, é a resposta a essas interrupções que define uma empresa séria. A XLabs Security está comprometida em fornecer a melhor e mais confiável experiência para nossos clientes, aprendendo com cada incidente e trabalhando incansavelmente para melhorar nossos sistemas e processos. Acreditamos na transparência e na comunicação aberta com nossos clientes, garantindo que eles estejam sempre informados sobre o status de nossos serviços. Nós entendemos que a confiança é ganha através de ações consistentes e confiáveis, e é por isso que nos esforçamos para fornecer um serviço de alta qualidade e confiável.