28 jan às 15:22

DeepSeek faz o Vale do Silício falar

AI, IA, deepseek, garry tan, Marc Andreessen, TC, Yann LeCun,

Desde que a empresa chinesa de IA DeepSeek lançou uma versão aberta de seu Modelo de Raciocínio R1 no início desta semana. Muitos no setor de TTecnologia têm feito grandes Declarações sobre o que a Empresa conseguiu. E o que isso Significa para o Estado da IA.

O Capitalista de Risco Marc Andreessen, por exemplo, postou que o DeepSeek é

“um dos avanços mais incríveis e impressionantes que já vi”.

O R1 aparentemente iguala ou supera o Modelo o1 da OpenAI em determinados Benchmarks de IA. E a Empresa Afirma que um de seus Modelos custou apenas US$ 5,6 milhões para ser Treinado. Em Comparação com as Centenas de Milhões de Dólares que as Principais Empresas Americanas pagam para treinar os seus.

Também parece ter conseguido isso diante das Sanções dos EUA. Elas Proíbem a Venda de Chips avançados para Empresas Chinesas. A MIT Technology Review informa que o sucesso da Empresa ilustra como as Sanções estão “levando Empresas iniciantes como a DeepSeek a inovar de forma a priorizar:

eficiência,
compartilhamento de recursos,
e colaboração”.

(Por outro lado, o Wall Street Journal informa que Liang Wenfeng, da DeepSeek, disse recentemente ao Primeiro-Ministro da China que:

as Restrições de Exportação Americanas ainda representam um Gargalo).

O CEO da Curai, Neal Khosla, ofereceu uma explicação mais simples. Alegando que a Empresa é uma “Operação Psicológica de Estado do Partido Comunista Chinês”. Isso é “fingir que o custo é baixo para justificar a fixação de um Preço Baixo. E esperar que todos mudem para ele [para] prejudicar a competitividade da IA nos EUA”. (Uma nota da comunidade foi anexada à sua postagem apontando que Khosla não oferece nenhuma evidência para isso. E que seu pai, Vinod, é um investidor da OpenAI).

É uma Ameaça?

Enquanto isso, o jornalista Holger Zschaepitz sugeriu que a DeepSeek “poderia representar a maior ameaça aos mercados de ações dos EUA”. Se uma empresa chinesa puder construir um Modelo de Ponta a Baixo Custo. Sem acesso a Chips Avançados, isso colocaria em questão:

“a utilidade das centenas de bilhões de investimento em capital que estão sendo despejados nesse setor”.

Em resposta, o CEO da Y Combinator, Garry Tan, argumentou que o sucesso da DeepSeek seria, na verdade, bom para seus concorrentes americanos. “Se os modelos de treinamento ficarem mais baratos, mais rápidos e mais fáceis”, escreveu ele no X, ‘a demanda por inferência (uso real da IA no mundo real) crescerá e se acelerará ainda mais, o que garante que o suprimento de computação será usado’.

E o cientista-chefe de IA da Meta, Yann LeCun, argumentou contra a Análise do Anúncio do DeepSeek pelas Lentes da China e dos Estados Unidos. Em vez disso, ele sugeriu que a verdadeira lição é que “os Modelos de Código Aberto estão superando os Modelos Proprietários”.

“A DeepSeek lucrou com a pesquisa aberta e o código aberto (por exemplo, PyTorch e Llama da Meta)”, escreveu LeCun no LinkedIn esta semana. “Eles tiveram novas ideias e as desenvolveram com base no trabalho de outras pessoas. Como o trabalho deles é publicado e de código aberto, todos podem lucrar com ele.”

Todo esse debate parece estar levando os Consumidores a Experimentar o Produto. Na tarde de domingo, o Assistente de IA da DeepSeek é o Principal Aplicativo Gratuito na Apple App Store, logo à frente do ChatGPT.

Fonte: TechCrunch

Leia outras notícias em nosso blog

Precisa de um Servidor Web? Dê uma olhada em nossos serviços