Contents
- O que é HPC?
- HPC vs Supercomputadores
- Principais setores que mais se beneficiam da HPC
- Uma breve história da HPC
- Principais concorrentes no campo da HPC
- Microsoft Corporation
- Intel
- Amazon Web Services
- DataDirect Networks
- Penguin Computing
- Dell Technologies
- IBM
- Alphabet
- Atos
- Exagrid
- Rescale
- Advanced HPC
- HPE
- Storj
- Bacula Enterprise
- Os desafios da HPC
- O futuro da HPC
O que é HPC?
HPC é Computação de alto desempenho – um processo de solução de problemas computacionais extremamente complexos com a ajuda de clusters de computadores e supercomputadores. A HPC utiliza elementos como algoritmos, arquiteturas de computador, linguagens de programação, eletrônica digital e software de sistema para criar uma infraestrutura complexa capaz de resolver tarefas incrivelmente sofisticadas usando o processamento paralelo de dados.
É uma tecnologia que existe há décadas, tendo recebido um aumento de popularidade relativamente recente devido à súbita expansão do número de desenvolvimentos e casos de uso relacionados à IA. As infraestruturas de HPC são regularmente encarregadas de armazenar, analisar e transformar grandes massas de dados que as empresas e os governos geram regularmente.
Os sistemas de HPC se esforçam para ser cada vez mais rápidos com o passar do tempo, realizando cálculos cada vez mais complexos, mas os desafios de otimizar vários aplicativos e designs podem, às vezes, ser um forte obstáculo a esse progresso. Como o gerenciamento de dados é essencial para a eficiência dos cálculos de HPC, esse desafio é algo que os fornecedores de software e hardware tentam resolver de várias maneiras diferentes.
No entanto, o mercado de HPC continua crescendo em um ritmo impressionante. A Straits Research projetou que o mercado de HPC crescerá de US$ 49,99 bilhões (2023) para US$ 91,86 bilhões (2030), com um CAGR de 9,1%.
O fato de a geração diária de dados ainda estar crescendo em todo o mundo coloca ainda mais pressão sobre os ambientes de HPC, motivando-os a procurar opções melhores e mais rápidas. O aumento das implantações de HPC na nuvem está provando ser uma opção adicional e eficaz para atenuar esses problemas, possivelmente oferecendo a alguns usuários uma alternativa mais eficiente e barata às infraestruturas de HPC no local.
Nesse contexto, é muito importante saber como a HPC funciona e quais são as dificuldades que ela está enfrentando agora (e no futuro próximo).
HPC vs Supercomputadores
Há muita sobreposição e confusão entre a computação de alto desempenho e os supercomputadores. Cada solução tem várias definições, e também há algumas semelhanças entre as duas. A maior diferença entre HPC e supercomputadores é o fato de que um supercomputador é um sistema único que pode ser várias vezes mais potente do que qualquer computador de nível de cliente. A HPC, por outro lado, tende a ser mais uma combinação de vários sistemas e recursos usados em paralelo.
É fácil ver como os supercomputadores e a HPC são tão semelhantes e, ao mesmo tempo, tão diferentes. Há também o fato de que os supercomputadores geralmente são muito mais caros e são personalizados para uma tarefa específica, enquanto a HPC é um sistema muito mais versátil que pode ser configurado para executar diferentes tarefas, se necessário.
Às vezes, algumas variantes de softwares mais antigos podem não ser capazes de colher todos os benefícios da HPC devido à incapacidade de utilizar os recursos de computação paralela de forma eficaz. Nesses tipos de casos de uso, os supercomputadores podem ter uma vantagem significativa e, muitas vezes, são a única opção.
Principais setores que mais se beneficiam da HPC
Há muitos setores diferentes que estão usando ativamente a HPC em seu trabalho, seja para engenharia, design, modelagem etc. Aqui estão alguns dos maiores grupos de casos de uso para soluções de HPC:
- Petróleo e gás. A HPC é usada para analisar novos locais potenciais de poços e melhorar a produtividade das perfuratrizes existentes.
- Fintech. A HPC é capaz de executar muitas formas diferentes de modelagem financeira e também pode rastrear tendências de ações em tempo real.
- Defesa. A HPC melhora drasticamente a capacidade das entidades governamentais de gerenciar enormes conjuntos de dados para realizar várias ações e operações relacionadas à segurança.
- Entretenimento. A HPC tem muitos casos de uso diferentes aqui, incluindo renderização de efeitos especiais para vídeos e filmes, criação de animações, ambientes 3D, transcodificação e muito mais.
- Saúde. A HPC é fundamental para o desenvolvimento de medicamentos e processos de pesquisa de cura no setor.
- Pesquisa. Os projetos científicos são o pão e a manteiga dos recursos da computação de alto desempenho, oferecendo uma maneira rápida e conveniente de gerenciar grandes volumes de dados para uma finalidade específica.
Uma breve história da HPC
A sobreposição contínua entre HPC e supercomputadores é o grande motivo pelo qual grande parte da história dos supercomputadores é frequentemente tratada como a história da HPC também. Toda a categoria de hardware remonta à década de 1940, passando por várias iterações antes de crescer em popularidade após a década de 1950 (IBM 7090, CDC 6600).
O conceito de computação paralela foi introduzido logo depois (após a década de 1980), como uma das primeiras menções a esse conceito na história, juntamente com o desenvolvimento de clusters de computadores que podiam executar tarefas complexas como um único ambiente interconectado.
Ao mesmo tempo, a popularidade dos computadores pessoais também continuou a crescer, trazendo cada vez mais interesse para o setor como um todo. Os clusters de HPC continuaram a crescer e a se desenvolver como um conceito ao longo dos anos, sendo a ideia de computação em nuvem uma das tendências mais recentes que muitas das melhores empresas de HPC do mercado oferecem atualmente. A HPC é um conceito extremamente eficaz e, com o futuro cada vez mais dependente de tecnologias como a computação quântica e a Inteligência Artificial, esse conceito só continuará a crescer e florescer com o passar do tempo.
Principais concorrentes no campo da HPC
O mercado de soluções de HPC é surpreendentemente grande, considerando a complexidade e o consumo de recursos que essas soluções podem ter. E, no entanto, a demanda geral por esses tipos de ofertas parece estar crescendo regularmente em muitos setores, razão pela qual a maioria das empresas de HPC continua crescendo e se tornando empresas muito grandes. A lista abaixo apresenta 15 exemplos diferentes de empresas que oferecem recursos de HPC de uma forma ou de outra.
Deve-se observar que o termo “solução de HPC” é relativamente amplo e pode abranger vários grupos de empresas diferentes. Algumas dessas empresas oferecem HPC como um serviço de nuvem, outras fornecem implantação de HPC no local e há também várias opções que são bem conhecidas por sua contribuição para o setor em termos de nada além de recursos de hardware.
Microsoft Corporation
A Microsoft é uma gigante tecnológica bem conhecida, e seu serviço de nuvem Azure é, sem dúvida, um dos maiores concorrentes em seu campo. Dois elementos diferentes contribuem especificamente para as implementações de HPC: Azure CycleCloud e Azure Batch.
O primeiro é uma solução complexa que oferece gerenciamento de cargas de trabalho de HPC com muitos recursos valiosos. O segundo é uma solução de escalonamento e programação que pode calcular e dimensionar os recursos necessários com a quantidade de trabalho que precisa ser feito usando um ambiente de HPC. Não é incomum que a Microsoft também colabore com vários fornecedores de hardware para criar hardware personalizado para sua infraestrutura do Azure, a fim de lidar com fluxos de trabalho de HPC.
A combinação de hardware e software, sob o olhar atento da Microsoft, cria o que é conhecido como Microsoft Azure HPC – uma infraestrutura abrangente e específica que abriga soluções prontas para HPC com várias vantagens em relação às versões tradicionais de HPC no local.
É uma solução rápida, escalável e econômica que reduz muito o custo inicial da implantação de HPC, oferece suporte a vários tipos de carga de trabalho de HPC e pode ser personalizada para ter recursos suficientes para os objetivos e casos de uso específicos de um cliente. Ele também pode ser integrado a outros produtos do Azure, como o Azure Machine Learning, criando várias novas oportunidades em HPC.
Intel
Outra empresa tecnológica famosa é a Intel Corporation, uma das maiores empresas de fabricação de CPU do planeta. Os processadores Intel Xeon são feitos especificamente para HPC e ambientes semelhantes, independentemente do setor em que são usados. A Intel também fornece vários kits de ferramentas e documentos para simplificar o processo de programação de sistemas baseados em Xeon.
Algumas das vantagens mais significativas dos processadores Intel Xeon no contexto da HPC são:
- Scalability.
- Desempenho do núcleo.
- Desempenho da memória.
- Capacidades de simulação.
- ISA.
Os processadores Xeon são conhecidos por sua estrutura de vários núcleos, que foi criada para distribuir a carga entre dezenas de núcleos de processador simultaneamente. Esse é um caso de uso perfeito para cargas de trabalho de HPC, acelerando o tempo necessário para executar um processo de cálculo médio para pesquisadores e outros especialistas em HPC.
Os cálculos em si nos processadores Xeon são muito mais rápidos por causa do maior número de núcleos e da maior velocidade de clock de cada núcleo, oferecendo um desempenho significativamente mais alto em todos os aspectos, especialmente quando se trata de cálculos complexos com os quais a HPC geralmente lida.
Como a HPC geralmente trabalha com conjuntos de dados incrivelmente grandes, o alto desempenho da memória é praticamente um requisito. Felizmente, os processadores Xeon vêm com controladores de memória mais rápidos e canais de memória mais amplos para garantir que todo o potencial do hardware de memória seja liberado e que não haja gargalos no lado da CPU.
O desempenho não é tudo o que a HPC precisa do hardware como um todo – a estabilidade para períodos prolongados de cálculos intensivos é igualmente importante. O setor se refere a isso como RAS, ou Confiabilidade, Disponibilidade e Capacidade de Manutenção. Trata-se de uma combinação de recursos como diagnósticos avançados, correção de erros e muitos outros que garantem o mínimo de tempo de inatividade e a integridade total dos dados.
ISA significa Instruction Set Architecture (Arquitetura de Conjunto de Instruções), é um conjunto de instruções detalhadas para cálculos matemáticos e científicos. O principal objetivo da ISA é maximizar a conveniência e melhorar o desempenho das cargas de trabalho de HPC ao trabalhar com os processadores Intel Xeon.
O restante dos recursos da Intel no campo da HPC ainda gira em torno dos processadores Xeon, de uma forma ou de outra. Por exemplo, o oneAPI HPC Toolkit da Intel é uma combinação de várias ferramentas de desenvolvimento que facilitam o aprimoramento do desempenho e a otimização das operações de programação executadas nos processadores Xeon. Como alternativa, há também o pacote HPC Software and Tools que fornece várias soluções para otimização do sistema, análise de desempenho e gerenciamento de carga de trabalho para soluções HPC executadas em processadores Xeon.
Amazon Web Services
A Amazon Web Services é uma subsidiária da Amazon, uma das maiores empresas do mundo. A principal especialidade da AWS é a computação em nuvem em diferentes setores e para diferentes públicos-alvo, incluindo clientes comuns, empresas e até mesmo órgãos governamentais. Ela também pode fornecer recursos de HPC baseados em nuvem para instituições financeiras, organizações de pesquisa, empresas de engenharia e empresas científicas voltadas para a saúde.
A AWS se esforça para acompanhar as tendências modernas no campo tecnológico, sendo que suas tentativas de trazer o poder da IA e do ML para seus serviços são o exemplo mais recente. Dessa forma, o Amazon SageMaker agora pode melhorar seus recursos de análise de dados por meio da introdução do aprendizado de máquina nesse fluxo de trabalho.
Isso não quer dizer que a atual oferta de nuvem da Amazon não seja incrível por si só. Ela oferece muita personalização em termos de quantos recursos são necessários para cada cliente, combinando escalabilidade com acessibilidade em um único pacote. O AWS como um todo é relativamente fácil de gerenciar, e sua infraestrutura global possibilita a implantação de infraestruturas de nuvem HPC em muitas partes diferentes do mundo com pouco ou nenhum problema.
Como a AWS é uma plataforma enorme com dezenas de recursos e funcionalidades diferentes, é aconselhável mencionar quais desses recursos estão diretamente ligados aos recursos de HPC da Amazon:
- Amazon FSx é um sistema de arquivos de alto desempenho usado para gerenciar conjuntos de dados de HPC que tendem a ser extremamente grandes.
- AWS Batch é uma ferramenta dedicada ao escalonamento e à programação de trabalhos para cargas de trabalho de HPC especificamente.
- Amazon EC2 é uma coleção de infraestruturas virtuais sob demanda, incluindo GPUs poderosas, CPUs rápidas e outros hardwares/softwares criados explicitamente para cargas de trabalho de HPC.
- AWS ParallelCluster facilita a implantação e o controle de clusters de HPC, com a capacidade de aumentar ou diminuir o número de clusters quando necessário.
- EFA (Elastic Fabric Adapter) é uma infraestrutura de rede de baixa latência que oferece a maior velocidade de comunicação possível entre clusters na infraestrutura de HPC.
DataDirect Networks
Embora a DataDirect Networks não seja tão conhecida como alguns outros concorrentes desta lista, ela é considerada a empresa privada de armazenamento de dados mais importante. Ela está entre os nomes mais conhecidos do mercado de HPC, oferecendo infraestruturas de alto desempenho para fins específicos.
Os recursos da DataDirect incluem melhorias em áreas como colaboração (com a ajuda do gerenciamento de dados em várias nuvens), otimização (com melhor desempenho de armazenamento) e baixo custo (devido a soluções de HPC escaláveis e eficientes).
Algumas das conquistas e vantagens mais significativas da DataDirect Networks são:
- Sistemas de arquivos paralelos permitem que os nós de HPC acessem os mesmos dados simultaneamente, melhorando o desempenho em toda a linha.
- Os mais de 20 anos de experiência da DDN conferem a ela experiência e conhecimento sem precedentes no setor, permitindo que ela forneça alguns dos melhores ambientes de HPC do mercado.
- Escalabilidade, segurança e estabilidade são igualmente cruciais para a DDN. Eles garantem que os dados confidenciais da pesquisa sejam protegidos e, ao mesmo tempo, garantem que o ambiente seja escalável, mas estável.
- O desempenho do Exascaler está dentro das possibilidades das soluções HPC da DataDirect Networks, melhorando significativamente o desempenho da pesquisa e de outras tarefas orientadas para HPC.
A computação exascale é um tipo de sistema de supercomputador que pode realizar operações de computação nos níveis exascale, que é um nível totalmente novo de desempenho de computação que exige um sistema de armazenamento especificamente modificado para ser capaz de trabalhar com esse desempenho em sua plenitude.
Penguin Computing
A Penguin Computing representa outro fornecedor privado de HPC, criado em 1998. A Penguin Computing pode fornecer uma série de produtos e serviços, como servidores Linux, software de gerenciamento de clusters, soluções de computação em nuvem, soluções de IA e muito mais.
A Penguin Computing oferece soluções de HPC simplificadas para seus clientes, com alto desempenho e baixa complexidade de gerenciamento. Essas soluções podem ser escalonadas facilmente, combinando hardware e software de várias maneiras para atender aos requisitos de cada público-alvo.
A contribuição da Penguin Computing para o setor de HPC é bastante significativa. Ela oferece infraestruturas de HPC baseadas em nuvem com suporte à estrutura de IA, possibilitando a combinação dos dois, se possível, como meio de aprimorar as cargas de trabalho de HPC. Há também o fato de que o software da Penguin Computing facilita muito o gerenciamento de ambientes complexos de HPC, independentemente do tamanho ou da sofisticação.
A oferta da empresa também abrange ambientes físicos de HPC e até mesmo servidores otimizados para Linux com a mesma finalidade. Uma combinação de memória rápida, processadores de alto desempenho e hardware de GPU eficiente está incluída em todos os pacotes. A Penguin Computing também oferece suporte ao TrueHPC – uma iniciativa combinada da AMD e da NVIDIA, que promove a colaboração e a inovação no mercado com práticas recomendadas e padrões abertos.
Dell Technologies
A Dell é outro nome conhecido no ambiente tecnológico geral. Como marca, a Dell pertence à Dell Technologies, sua empresa controladora, que foi criada em 2016 como resultado da fusão entre a Dell e a EMC. A Dell Technologies oferece muitos serviços e soluções, incluindo opções de hardware e software para diferentes clientes.
Isso também inclui recursos de HPC, como implementação de produção, avaliação, testes, criação de peças de prova de conceito, etc. A oferta da Dell no ambiente de HPC não é muito diferente de outras empresas que fornecem infraestrutura de HPC baseada em nuvem sob demanda. É uma alternativa rápida e relativamente barata às implementações de HPC no local que também podem ser facilmente dimensionadas em ambos os sentidos e exigem muito menos manutenção. A Dell também se orgulha de seus tempos de implementação de HPC, oferecendo implementações de HPC extremamente rápidas para clientes com restrições de tempo.
A experiência da Dell como empresa tecnológica é respaldada por décadas de trabalho no setor. Ela oferece um profundo entendimento de como a HPC funciona e do que ela precisa para funcionar adequadamente. As soluções de HPC baseadas em nuvem da Dell são distribuídas usando milhares de servidores Dell EMC e três potentes supercomputadores conectados em uma única infraestrutura usando sistemas sofisticados de gerenciamento de armazenamento.
Há uma grande quantidade de hardware que a Dell pode fornecer como parte de sua infraestrutura de HPC, seja hardware de rede, hardware de armazenamento ou hardware de servidor. Todos esses componentes são personalizados para cargas de trabalho de HPC desde o início. Ao mesmo tempo, os recursos da Dell não se limitam ao fornecimento de hardware em várias formas – há também serviços como:
- Desenvolvimento de prova de conceito
- Suporte contínuo
- Implementação do produto
- Avaliação inicial
IBM
A IBM é uma empresa americana de tecnologia que existe há mais de 100 anos. Sua filial IBM Spectrum Computing foi criada para fornecer serviços de HPC a seus clientes de várias maneiras diferentes. Há ofertas distintas que a IBM pode oferecer, incluindo:
- Serviços de alto desempenho para análise, uma opção perfeita para os setores financeiro ou de ciências biológicas – ou qualquer outro campo de trabalho que exija cálculos de carga de trabalho com uso intensivo de dados regularmente.
- Spectrum HPC, um conjunto completo de ferramentas para otimizar e gerenciar ambientes HPC existentes ou criar novos ambientes.
- High-Performance Services for HPC, uma solução para todo o ciclo de vida da infraestrutura de HPC, começando com o planejamento e a implantação e terminando com o suporte contínuo até o desligamento.
A empresa é conhecida por seus investimentos em tecnologias de computação ao longo dos anos – ATM, DRAM, disquetes e unidades de disco rígido são apenas alguns exemplos das criações da IBM. A longa lista de invenções que podem ser atribuídas diretamente à IBM é uma prova de suas capacidades quando se trata de inovação e desenvolvimento de tecnologia.
A IBM também oferece suporte a implantações de HPC híbrida com facilidade, oferecendo a capacidade de conectar seus recursos de HPC baseados em nuvem com o hardware local que o cliente talvez já tenha. Os recursos de HPC da IBM são rápidos e personalizáveis, aproveitando décadas de experiência no campo para criar um nível de serviço impressionante no setor.
Alphabet
A Alphabet é um conglomerado de tecnologia de grande porte com sede na Califórnia; é frequentemente considerada uma das empresas mais valiosas do planeta. A Alphabet foi criada após uma reestruturação de uma empresa conhecida chamada Google em 2015, permanecendo como a empresa controladora do Google até hoje.
É possível dividir os recursos relacionados à HPC do Google em seis categorias:
- O Google Cloud pode fornecer infraestrutura personalizada para casos de uso muito específicos e restritos, oferecendo uma incrível combinação de potência de computação e armazenamento. Isso é aprimorado pela capacidade de computação em nuvem, pelas soluções de armazenamento de dados e pela infraestrutura de rede de alto desempenho, que são necessárias para manter toda essa infraestrutura. As soluções de HPC em nuvem do Google são provavelmente seu principal envolvimento direto no espaço de HPC.
- O Google também participa com frequência e está envolvido com várias organizações de pesquisa e instituições educacionais para desenvolver novas tecnologias no mercado de HPC e aprimorar as já existentes. Isso ajuda diferentes empresas do mercado a alcançar novos mercados que também precisam do poder da HPC, incluindo ciência climática, biotecnologia, computação quântica, etc.
- O status geral do Google como uma das maiores empresas de tecnologia do mundo faz dele uma ótima opção para serviços de HPC devido a seus recursos de rede rápida, altos níveis de eficiência, disponibilidade constante e escalabilidade impressionante.
- A ampla versatilidade do Google é uma enorme vantagem por si só, oferecendo um pacote de soluções que funciona tanto para ambientes acadêmicos quanto comerciais, quando necessário. Isso permite que a Alphabet crie valor em diferentes mercados, melhorando os níveis gerais de serviço em diferentes setores.
- A capacidade do Google de integrar novas tecnologias às soluções existentes impulsiona a inovação e, ao mesmo tempo, melhora o desempenho e a versatilidade de seu serviço de HPC.
- Isso não quer dizer que as tecnologias mais tradicionais não estejam sendo constantemente desenvolvidas e aprimoradas pela Alphabet. Longe disso – a dedicação absoluta do Google em trabalhar com tecnologias de ponta serve constantemente para melhorar os recursos de soluções como HPC para diferentes setores.
Atos
A Atos é uma grande empresa de serviços de TI que se concentra principalmente em fornecer e gerenciar infraestruturas de HPC. Ela pode implantar essas infraestruturas, gerenciá-las e consultar seus usuários quando se trata de problemas que possam ocorrer nessas infraestruturas.
A Atos pode oferecer opções de infraestrutura de HPC no local e na nuvem. Ela também fornece serviços de gerenciamento de HPC, aliviando o pesado fardo de gerenciar infraestruturas complexas de HPC de seus usuários. Outros serviços da Atos incluem programas de treinamento avançado em torno dos recursos de HPC para garantir que os clientes possam usar o software e o hardware ao máximo, caso queiram gerenciá-los por conta própria.
A Atos pode fornecer e gerenciar implementações híbridas de HPC, bem como infraestruturas no local e na nuvem separadamente. Isso é combinado com uma escalabilidade impressionante, que é um recurso muito valioso em um ambiente moderno com demandas crescentes de dados.
Para os usuários de HPC, a Atos é um orquestrador e consultor confiável no setor, oferecendo um pacote completo de infraestruturas de HPC e a capacidade de gerenciá-las dentro da mesma empresa. Isso deixa os usuários finais com muito mais tempo para se concentrarem em pesquisas ou outras tarefas que exigem HPC de alguma forma.
Exagrid
O ExaGrid é uma solução de armazenamento de backup orientada principalmente por hardware, criada especificamente para grandes volumes de dados. Ele se baseia em um modelo de armazenamento em camadas e em uma política de backup inteligente que torna os backups mais recentes sempre acessíveis, sem necessidade de compactação. É uma solução de backup rápida, dimensionável e confiável que também pode ser excelente para a proteção de dados HPC, combinando desempenho e economia.
Para começar, o Exagrid foi projetado para lidar com grandes massas de dados, o que o torna especificamente útil para implementações de HPC. Ele também oferece processos de restauração extremamente rápidos para armazenamento regular e VMs sem nenhum tipo de reidratação necessária antes que os dados possam ser usados novamente.
Os outros recursos da ExaGrid incluem uma impressionante relação custo-benefício devido à arquitetura de preços em camadas e à dependência de uma combinação de hardware e software para suas tarefas de backup e recuperação. Cada unidade é seu próprio sistema autônomo com armazenamento, memória, processador e outros elementos necessários, o que torna a escalabilidade muito mais fácil a longo prazo, pois determinados elementos podem ser substituídos em vez de todo o appliance.
Rescale
A Rescale é um desenvolvimento relativamente recente nesse setor – é uma empresa de software que foi criada em 2011 e agora está oferecendo serviços e recursos de software em nuvem. A oferta da Rescale é chamada de Cloud Intelligent Computing (computação inteligente em nuvem); ela pode ser usada para otimizar os fluxos de trabalho HPC existentes (principalmente exemplos locais).
A empresa também apresenta regularmente tecnologias de nuvem novas e aprimoradas em HPC para facilitar a conexão de fluxos de trabalho de HPC no local com suas contrapartes centradas na nuvem. Por exemplo, a capacidade de acessar recursos de HPC remotamente é uma grande vantagem para os esforços de colaboração e inovação no setor, já que a conexão é segura e protegida, e a capacidade de entrar em contato com esses recursos melhora consideravelmente a mobilidade das operações de HPC.
Além disso, o Rescale pode oferecer provisionamento rápido para clusters de HPC baseados em nuvem, resolvendo um dos maiores problemas das implantações originais de HPC (longo tempo de provisionamento). Dessa forma, as soluções de HPC podem ser ampliadas ou reduzidas rapidamente, melhorando significativamente a conveniência e o desempenho dessas implementações.
A Rescale também não tenta prender seus clientes a trabalhar com um único provedor de armazenamento em nuvem, criando oportunidades de suporte com vários provedores de HPC em nuvem e, ao mesmo tempo, podendo gerenciar todos eles por meio da Rescale.
A empresa ainda pode oferecer todas as vantagens básicas de um ambiente de HPC em nuvem, seja um tempo de implementação mais rápido em comparação com o HPC local, escalabilidade mais rápida, gerenciamento mais fácil e custo inicial mais baixo. Esses tipos de vantagens funcionam bem com os próprios aprimoramentos da Rescale no fluxo de trabalho HPC existente, criando um pacote bastante interessante de serviços e ambientes.
Advanced HPC
Outra empresa relativamente pequena (em comparação com a Microsoft e a Amazon), especializada em serviços de HPC, chama-se exatamente isso: Advanced HPC. Ela foi fundada em 2009 e ainda continua sendo um dos principais fornecedores de HPC do mercado. A Advanced HPC não só oferece servidores de alto desempenho, soluções de rede e ofertas de infraestrutura, como também oferece muitas oportunidades de treinamento.
Outros recursos da Advanced HPC incluem vários serviços profissionais no mercado, inclusive a capacidade de gerenciar:
- Clusters de HPC,
- NAS para soluções de negócios,
- Sistemas de arquivos paralelos e muito mais.
A AHPC oferece a capacidade de criar soluções HPC completas e prontas para uso a partir do zero, em vez de apenas vender componentes separados para sistemas HPC. Cada um desses sistemas pode ser personalizado de uma forma específica necessária para o campo de trabalho do cliente, criando uma abordagem exclusiva para cada cliente com o qual a AHPC trabalha.
O pacote regular de vantagens também se aplica à AHPC – o custo inicial mais baixo está incluído, a infraestrutura é muito mais flexível, mais fácil de gerenciar e o tempo de implementação é muito superior a qualquer implementação no local.
HPE
HPE é a sigla de Hewlett Packard Enterprise, uma empresa multinacional de tecnologia da informação dos Estados Unidos. Ela foi criada em 2015 como parte da divisão da empresa Hewlett-Packard. A HPE está focada principalmente no segmento B2B do mercado, oferecendo recursos como redes, servidores, armazenamento, conteinerização e muito mais.
Os recursos da HPE como um dos fornecedores de HPC mais proeminentes incluem:
- Armazenamento de alto desempenho – uma solução de armazenamento criada especificamente para cargas de trabalho rápidas e de alto volume que a HPC é conhecida por esperar de suas computações e cálculos.
- Servidores otimizados para HPC – combinações de recursos de rede rápida, processadores de alta velocidade e pools de memória extremamente grandes.
- Servidor HPE Superdome Flex – um servidor modular exclusivo para cargas de trabalho de HPC.
A HPE pode oferecer capacidades de consultoria no campo da HPC (design de infraestrutura ideal e metas de desempenho esperadas), capacidades de HPC baseada em nuvem (recursos básicos de implantação de HPC na nuvem) e suporte abrangente ao cliente para ambientes de HPC existentes (amplo conhecimento técnico sobre o tópico de HPC, solução de problemas, manutenção contínua e muito mais).
Os recursos de HPC em nuvem da HPE oferecem o mesmo conjunto de benefícios que a maioria dos provedores de HPC em nuvem pode ter, incluindo gerenciamento de infraestrutura mais fácil, menor custo inicial de implantação, alta velocidade de implantação e desempenho ainda melhor graças ao hardware da HPE, que é personalizado e otimizado para cargas de trabalho de HPC.
Storj
O Storj é um serviço de armazenamento em nuvem distribuído que utiliza tecnologias de blockchain para oferecer uma solução segura para o armazenamento de dados, especialmente para informações confidenciais, como dados de treinamento de HPC. O Storj pode oferecer acesso altamente eficiente aos dados, independentemente de onde estejam localizados especificamente. Ele também pode trabalhar com grandes volumes de dados com facilidade, o que o torna um dos principais concorrentes para casos de uso voltados para HPC.
É uma solução econômica com uma estrutura descentralizada, criando uma combinação incomum de alta segurança e baixo preço no mesmo pacote. A estrutura em questão também oferece muita redundância por padrão, o que a torna extremamente valiosa para todos os casos de uso que valorizam a alta disponibilidade e a durabilidade (a HPC é um dos principais exemplos desses clientes).
Bacula Enterprise
O Bacula Enterprise é uma plataforma de backup e recuperação altamente segura e abrangente que se destaca em ambientes de HPC, com muitos recursos e funcionalidades específicos para HPC à sua escolha. Ele suporta muitos tipos diferentes de armazenamento, incluindo armazenamento físico, armazenamento virtual, armazenamento em nuvem, bancos de dados, aplicativos e assim por diante. A própria solução foi projetada para lidar com sistemas de dados vastos e complexos sem depender de preços baseados em capacidade, o que a torna uma opção interessante para muitos setores e campos de especialização, inclusive HPC.
O sistema modular do Bacula o torna uma ótima opção para praticamente qualquer ambiente complexo, devido à capacidade de expandir sua funcionalidade original com o mínimo de esforço. Ele também é excelente para gerenciar e lidar com grandes volumes de dados em diferentes formas – um recurso significativo que as infraestruturas de HPC estão sempre procurando. O software do Bacula também é altamente escalável e personalizável, expandindo significativamente seus recursos em termos de clientela potencial. O sistema de assinatura que o Bacula Enterprise utiliza é outra vantagem para os setores que trabalham com grandes massas de dados regularmente, como o setor de HPC. Por exemplo, o modelo de licenciamento é altamente modular, o que significa que os usuários só pagam taxas de licença para os módulos (ou plugins) utilizados. Melhor ainda, o Bacula não estrutura seu licenciamento por volume de dados, o que significa que o software não é apenas facilmente escalável por design, mas também por preço.
Outra prova das capacidades do Bacula no campo da HPC é o número de diferentes clientes que ele reuniu ao longo dos anos, incluindo organizações que estão usando infraestruturas de HPC regularmente – Queen’s University School of Computing, Texas A&M University, University of Ghent e até mesmo a própria NASA. Como resultado de seus níveis mais altos de segurança, o Bacula é utilizado pela maior organização de defesa do mundo e pelo maior credor não bancário do mundo.
Uma área importante em que o Bacula contribui para o mundo da HPC é a conformidade. Para muitas organizações que estão cada vez mais precisando atender aos requisitos regulatórios e às necessidades de conformidade, os extensos relatórios do Bacula em ambientes HPC inteiros ajudam-nas a alcançar os padrões e as certificações para que estejam adequadamente operacionais.
Os desafios da HPC
A HPC pode ser uma ferramenta muito poderosa nas circunstâncias certas, mas a tecnologia tem seu quinhão de desvantagens e desafios. Alguns desses desafios são relativamente comuns em um campo em rápida evolução como a HPC, enquanto outros são um pouco mais incomuns em comparação.
- As infraestruturas de HPC no local geralmente são extremamente caras em termos de preço inicial. O serviço de HPC em nuvem é uma boa alternativa, muito mais barata em comparação, mas pode não oferecer a flexibilidade e a conveniência de uma infraestrutura física gerenciada pessoalmente. Por isso, muitas empresas tentam trabalhar com alguma forma de ambiente de HPC híbrido, o que também oferece seus próprios desafios relacionados à complexidade.
- Os sistemas de HPC utilizam dezenas de GPUs e CPUs em uma única solução, e a compatibilidade é um assunto muito problemático para essas soluções, exigindo muito conhecimento e recursos para garantir que o sistema esteja funcionando corretamente (um grande problema para implantações de HPC no local). A mesma lógica se aplica ao lado do software do tópico – a paralelização não é uma tecnologia plug-and-play, ela exige muita otimização e configuração para garantir que as tarefas computacionais sejam distribuídas uniformemente entre os recursos da HPC.
- O rápido avanço geral do campo, especialmente quando se trata de melhorias relacionadas à IA, torna ainda mais caro acompanhar os avanços relacionados à HPC em termos de hardware e software. É verdade que esse é um problema muito maior para instalações de HPC no local, mas a HPC baseada em nuvem também é suscetível ao mesmo problema – e a inconveniência de atualizações regulares resultaria em um custo de serviço mais alto, mais cedo ou mais tarde.
- O gerenciamento de HPCs como um todo pode ser uma tarefa extremamente difícil, com a qual poucos profissionais de TI conseguem lidar. O problema geral é ainda pior para implementações de HPC híbridas devido à combinação de soluções de HPC físicas e virtuais. Encontrar até mesmo um desses profissionais pode ser bastante desafiador, e manter essa mesma pessoa na empresa é um desafio ainda maior em um ambiente moderno com alto nível de concorrência.
- A segurança de dados como um todo continua sendo um problema significativo para qualquer setor moderno, incluindo HPC – especialmente quando se trata de ambientes de HPC híbridos e baseados em nuvem.
- As preocupações existentes com o consumo de energia também estão presentes nas soluções de HPC, pois essas soluções usam várias unidades de hardware ao mesmo tempo, aumentando exponencialmente os níveis gerais de consumo de energia. A eficiência energética é um tópico muito importante nesse contexto.
O futuro da HPC
Embora seja verdade que grande parte da popularidade recente da HPC possa ser atribuída ao aumento repentino da IA como a mais recente “tendência de TI”, o cenário geral dessas tecnologias de alto nível é relativamente volátil, forçando os fornecedores de HPC a se adaptarem e evoluírem o mais rápido possível para se manterem relevantes. Dessa forma, o setor de HPC continuará existindo enquanto houver demanda por potência de computação maciça para casos de uso específicos – seja IA, IoT, geração de imagens 3D, combinada com um dos muitos tipos diferentes de áreas de aplicação, como simulação de física de partículas, análise meteorológica, descoberta de medicamentos e modelagem molecular, sequenciamento de genoma, exploração espacial, exploração de petróleo e gás, geração de imagens sísmicas e modelagem de terremotos etc. Os desenvolvimentos empolgantes e significativos da HPC, tanto no aspecto técnico quanto no estratégico, significam que essa disciplina tem um futuro brilhante e certamente contribuirá muito para a humanidade no futuro.