Vivendo de Renda com Ações
Compartilhar no LinkedinCompartilhar no FacebookCompartilhar no TelegramCompartilhar no TwitterCompartilhar no WhatsApp
Compartilhar
Home
Negócios
Notícias
Chinesa DeepSeek lança novo modelo experimental de IA

Chinesa DeepSeek lança novo modelo experimental de IA

A DeepSeek lança novo modelo de inteligência artificial (IA). A empresa, uma das startups chinesas mais comentadas do setor, voltou aos holofotes nesta semana com o lançamento do DeepSeek-V3.2-Exp, uma versão experimental de seu modelo atual. A empresa ganhou fama no ano passado ao lançar de forma repentina o modelo R1, que surpreendeu o Vale do Silício por demonstrar ser possível treinar grandes modelos de linguagem em chips menos potentes e com menos recursos, sem perder competitividade.

A nova versão traz como principal inovação o recurso chamado DeepSeek Sparse Attention (DSA). A tecnologia funciona como um filtro inteligente, que seleciona apenas os dados mais relevantes em uma tarefa, reduzindo o tempo e o custo de processamento. Na prática, a promessa é tornar o modelo até duas vezes mais eficiente e cortar pela metade os custos operacionais em comparação à versão anterior.

“O V3.2 mantém o foco em eficiência, redução de custos e compartilhamento de código aberto”, afirmou Adina Yakefu, líder da comunidade chinesa da Hugging Face, em entrevista ao portal CNBC.

DeepSeek lança novo modelo de IA: ideia é dar acesso a sistemas de ponta

Especialistas avaliam que esse avanço pode abrir espaço para que pesquisadores, startups e empresas menores tenham acesso a sistemas de IA de ponta sem arcar com custos elevados. “É significativo porque deve tornar o modelo mais rápido e econômico de usar, sem uma queda perceptível no desempenho”, explicou Nick Patience, vice-presidente do The Futurum Group.

Mas nem todos estão convencidos dos benefícios. A investidora Ekaterina Almasque, cofundadora do fundo BlankPage Capital, chama atenção para os riscos da atenção esparsa. Segundo ela, ao descartar parte das informações, o modelo pode acabar eliminando dados importantes, comprometendo a confiabilidade dos resultados.

Publicidade
Publicidade

“Eles podem perder nuances essenciais. A grande dúvida é se a filtragem é feita da forma correta”, alertou. Para críticos, esse pode ser um desafio em áreas que exigem precisão, como segurança, saúde ou finanças.

Apesar das ressalvas, a DeepSeek reforça que o V3.2-Exp mantém o mesmo desempenho de seu antecessor, o V3.1-Terminus, e destaca sua compatibilidade imediata com chips chineses como Ascend e Cambricon. Isso significa que o modelo pode rodar em hardware local, sem necessidade de adaptações, o que fortalece a posição da China na corrida tecnológica com os Estados Unidos.

Código aberto

Outro ponto estratégico é a decisão de abrir o código e disponibilizar ferramentas para que outros desenvolvedores possam usar e aprimorar o modelo. Para alguns analistas, essa postura colaborativa ajuda a acelerar inovações, mas também levanta a questão da sustentabilidade do negócio, já que a tecnologia em si não pode ser patenteada. “A vantagem competitiva da DeepSeek não está na ideia de modelos esparsos, que já existe desde 2015, mas em como ela aplica essa filtragem de forma eficiente”, avaliou Almasque.

A própria companhia reconhece que o lançamento do V3.2-Exp é apenas um “passo intermediário” antes de uma arquitetura mais avançada. Para Nick Patience, isso reforça a proposta de valor da empresa. “A eficiência está se tornando tão importante quanto a potência bruta”, afirmou.

Com isso, a DeepSeek aposta em consolidar seu espaço no longo prazo, mantendo a comunidade de desenvolvedores envolvida e buscando entregar soluções baratas, eficazes e acessíveis. Como destacou Yakefu, “as pessoas sempre buscarão o que é confiável e econômico”.