Índice
No último final de semana, uma inteligência artificial chamada DeepSeek, desenvolvida na China, está causando alvoroço no mundo da tecnologia e fazendo despencar em mais de 1 trilhão de dólares o valor das ações de gigantes americanas como a NVIDIA, Google, Meta e Microsoft. Entenda como ela funciona e como pode impactar o mundo da tecnologia, mas especificamente o ChatGPT da OpenAI.
O que é a DeepSeek
A DeepSeek é uma empresa chinesa de inteligência artificial, criada em 2023 por Liang Wenfeng, empresário chinês e cofundador do fundo de hedge quantitativo High-Flyer. Esse fundo, famoso por usar técnicas de aprendizado de máquina no investimento em ações, é também o atual financiador das pesquisas de IA da empresa.
De 2023 para cá, a empresa vem atraindo a atenção global em razão do rápido desenvolvimento de seus modelos de linguagem ou LLMs.
Desenvolvimento de baixo custo
A principal vantagem dos modelos está no seu custo de desenvolvimento. Em um artigo divulgado recentemente, a empresa explicou que seu modelo de linguagem DeepSeek-V3 utilizou 2 mil placas H800 da NVIDIA, que já são relativamente antigas, para o treinamento a um custo total de 5,5 milhões de dólares.
Para comparação, isso é apenas uma fração do custo de treinamento de modelo como o Llama 3.3 da Meta, que só esse ano deve gastar mais de 65% bilhões de dólares no seu aprimoramento. Nessa comparação, os custos do DeekpSeek acabam ficando abaixo até do valor de salário anual de alguns executivos da empresa da Meta. Segundo analistas, as reduções de custo chegam a impressionantes 95%.
Tal feito acaba com o paradigma de que seriam necessários altos investimentos em infraestrutura de data centers e energia elétrica para o treinamento de IAs, fazendo da DeepSeek uma IA não só mais barata, como também ecologicamente mais sustentável.
Em tese, ao invés de usar data centers especializados com caríssimas GPUs projetadas para altas demandas de IA, os modelos da DeepSeek poderiam ser treinados até em computadores caseiros, com GPUs tradicionais, o que causa tanto espanto, quanto temor em empresas como a NVIDIA, que foi tão alavancada pela recente corrida de construção de data centers por empresas que buscam uma fatia nesse mercado.
Por essa razão, no que já ficou conhecido como o “DeepSeek Panic Day” ou “dia de pânico do DeepSeek”, em tradução livre, o dia 27 de janeiro foi marcado por quedas bilionárias em ações na NASDAQ, a bolsa de valores de empresas americanas de alta tecnologia, chegando a 3,5% do total negociado. O concorrente do ChatGPT tem tudo para bombar.
DeepSeek-V3 e DeepSeek-R1
Os modelos da empresa são também exemplo de eficiência. O DeepSeek-V3, por exemplo, ostenta desempenho impressionante em vários benchmarks, ao mesmo tempo em que requer significativamente menos recursos do que concorrentes como o Llama 3.3, da Meta. E o DeepSeek-R1, lançado em janeiro de 2025, foca em tarefas de raciocínio e desafia o modelo o1 da OpenAI com seus recursos avançados.
Em essência, ambas as opções de modelo de inteligência artificial chinês aprendem interagindo com seu ambiente e recebendo feedback sobre suas ações, semelhante a como os humanos aprendem por meio da experiência. Isso permite que eles desenvolvam habilidades de raciocínio mais sofisticadas e se adaptem a novas situações de forma mais eficaz. Essa abordagem é também mais barata do que o “aprendizado supervisionado por humanos”, usado pelas concorrentes.
Outra vantagem desta IA chinesa está na economia de recursos. Ao invés de utilizar todos os parâmetros do modelo para responder uma consulta, os modelos da DeepSeek selecionam apenas alguns “parâmetros específicos” ou “especialistas” para o tema. Essa ativação seletiva reduz significativamente os custos computacionais e aumenta a eficiência do modelo.
Explicando de uma forma mais simples, seria como ter uma grande equipe de especialistas disponíveis para todo o tipo de tarefa, mas chamar apenas os mais indicados para realizá-la num caso concreto, garantindo o uso eficiente e expertise no atendimento.
O DeepSeek-V3 também emprega técnicas de destilação, o que significa que ele transfere o conhecimento e as capacidades de modelos maiores para modelos menores e mais eficientes. É como um professor transferindo seu conhecimento para um aluno, permitindo que o aluno execute tarefas com proficiência semelhante, mas com menos experiência ou recursos.
O resultado é uma IA que ocupa menos espaço e recursos, com alta eficiência para funcionar em dispositivos menores, como smartphones e notebooks. Para disponibilizar o aplicativo para smartphones e também na versão web, a empresa usou o DeepSeek R1 como base e o transformou em app.
Modelo open source
Além da combinação de técnicas de eficiência e performance, os modelos também se aproveitam da colaboração inerente a projetos de código aberto (ou open source, em inglês).
Aqui, diferente de uma empresa como a OpenAI, que trabalha de forma privada no desenvolvimento de IAs, os modelos da DeepSeek tem seu código disponibilizado na web, podendo ser acessados, testados e até corrigidos pela comunidade global de desenvolvedores, o que também reflete em mais transparência e confiança sobre os resultados apresentados.
Inclusive, a empresa quer fomentar que qualquer um teste seus modelos e está liberando licenças para profissionais dele para facilitar com que outras companhias os utilizem.
A estratégia também fortalece a competitividade, atraindo talentos e destacando a posição de liderança da DeepSeek, numa espécie de marketing gratuito. A empresa não ganha por isso diretamente, mas se aproveitará da adesão em massa ao modelo, podendo monetizar por meio de serviços complementares, como suporte técnico ou versões premium, enquanto fomenta um ecossistema colaborativo e inovador.
Número 1 nas lojas de aplicativos
A curiosidade sobre o DeepSeek não ficou apenas entre os CEOs e engenheiros de tecnologia.
Lançado no dia 20 de janeiro, o R1, app do DeepSeek para iPhones e smartphones Android, parece estar seguindo o caminho de sucesso do concorrente ChatGPT. Ele já é o aplicativo mais baixado da App Store da Apple americana e o segundo no Brasil, atrás apenas do concorrente da OpenAI.
Na Play Store, loja do Android, o sucesso também é inegável: em todo o mundo, o chatbot chinês já foi instalado mais de um milhão de vezes.
Sam Altman, fundador e atual CEO da OpenAI, se pronunciou sobre o sucesso da DeepSeek. Ele citou que está de olho no que a IA chinesa pode fazer e que o primeiro modelo é impressionante. Veja os tweets e traduções abaixo.
O r1 da deepseek é um modelo impressionante, principalmente em relação ao que eles conseguem entregar pelo preço. Obviamente, entregaremos modelos muito melhores e também é legitimamente revigorante ter um novo concorrente! Faremos alguns lançamentos.
Mas, principalmente, estamos animados para continuar a executar nossas metas e acreditamos que mais computação é mais importante agora do que nunca para ter sucesso em nossa missão.
O mundo vai querer usar MUITA IA e realmente ficará surpreso com os modelos de próxima geração que estão chegando. Estamos ansiosos para trazer a vocês todos os AGI e além.
Sam Altman sobre sucesso da IA chinesa DeepSeek.
Implicações e viés político
Mas com o sucesso, também levantam-se suspeitas. Especialistas questionam se o total de GPUs utilizadas para treinar os modelos da DeepSeek foi sub-reportado, com a intenção de ocultar a utilização de hardware da NVIDIA que foi recentemente proibido de ser comercializado na China, em razão da guerra comercial com os Estados Unidos. Mas a empresa nega esse fato, afirmando que conseguiu treinar seu modelo mesmo com GPUs de baixa potência.
Também há indícios de censura na ferramenta, em linha com preceitos ou viés político do Partido Comunista Chinês. Por exemplo, quando questionada sobre o “massacre na Praça da Paz Celestial de Pequim em 1989”, onde centenas de ativistas foram mortos ou feridos pelo exército chinês, a IA se recusa a responder a pergunta.
O mesmo acontece quando a IA é questionada sobre o conflito entre a China e Taiwan. A DeepSeek cita que Taiwan faz parte da China e que “o governo chinês está comprometido com o princípio de Uma Só China e busca a reunificação pacífica do país.
O que vem em seguida?
A possibilidade de ter modelos de IA tão eficientes, a custos de infraestrutura expressivamente menores, está fazendo com que investidores repensem a compra ou até vendam suas ações de empresas de tecnologia voltadas para este setor.
Uma das lendas do venture capital americano, Marc Andreessen, vê o surgimento do DeepSeek como o “momento Sputnik da IA”, em referência ao lançamento histórico primeiro satélite em órbita em 1957, que marcou o momento em que a União Soviética superou temporariamente os Estados Unidos no campo da tecnologia espacial.
Fato é que a superioridade americana no campo das inteligências artificiais foi posta em cheque. E, por essa razão, é provável que uma retaliação do governo americano, talvez por meio de mais sanções à comercialização de tecnologias e chips americanos para empresas chinesas, seja anunciada.
Em reação ao caso, o novo presidente Donald Trump chamou a ascensão da empresa chinesa DeepSeek de “um alerta” para a indústria de tecnologia dos Estados Unidos, sinal de que uma reação deve vir em breve.
Vamos acompanhar o tema de perto. Enquanto isso, diga pra gente nos comentários: você acha que a DeepSeek pode tirar a liderança do ChatGPT?
Veja o vídeo
Veja também
Com informações: Yahoo l Ground News l Info Money l Forbes (1 e 2)
Descubra mais sobre Showmetech
Assine para receber nossas notícias mais recentes por e-mail.