Em janeiro deste ano, a startup de inteligência artificial DeepSeek lançou dois avanços através do seu novo modelo R1, redefinindo discretamente a economia da inteligência artificial.Este modelo atinge o máximo desempenho a 1/40 do custo do modelo anteriorA partir de dezembro de 2024, o modelo de linguagem grande V3 da DeepSeek reduziu os custos de treinamento em mais de 90%.
Duas das descobertas da DeepSeek chamaram muita atenção:DeepSeek revelou que pedir aos modelos de IA para elaborarem seus processos de raciocínio - uma abordagem de pesquisa conhecida como "chain-of-thought prompting" - melhorou a precisão e a eficiênciaEm segundo lugar, a DeepSeek utiliza a inteligência artificial para gerar os seus próprios conjuntos de dados, completamente independentes da rotulagem manual dos dados.Embora haja argumentos de que a DeepSeek não é tão barata como afirma, estes avanços certamente inauguraram uma nova era da economia da IA.
A estrutura de custos da inteligência artificial está a mudar drasticamente.e investimentos em infra-estruturasEsta mudança poderá alterar as forças do mercado, ajudando as startups ágeis a alcançar os gigantes tecnológicos a curto prazo, aumentando as margens de lucro.
As gigantes tecnológicas já investiram mais de 100 mil milhões de dólares no desenvolvimento de infraestruturas de IA, e continua a aumentar.Agora eles devem considerar como gerar um retorno sobre estes investimentos enormes e manter uma vantagem sobre algoritmos contra mais ágeisEm face de um ambiente em rápida evolução, tanto os gigantes tecnológicos como as empresas em fase de arranque enfrentam um sinal claro: aproveitar rapidamente a oportunidade do progresso tecnológico,ou ser eliminado.
O panorama do mercado de IA antes e depois do DeepSeek
Antes da ascensão da DeepSeek, as startups lutavam para competir com os gastos de infraestrutura dos gigantes da tecnologia,que investiu bilhões de dólares na construção de enormes centros de dados a cada trimestre e ganhou enormes vantagens com os avanços na tecnologia de inteligência artificialEstes gigantes não só dispõem de enormes recursos de dados, mas também reúnem um grande número de talentos de doutoramento, e o progresso dos algoritmos também depende da sua forte força técnica.As redes de distribuição estabelecidas há muito tempo permitem-lhes distribuir produtos rapidamente para os clientes existentes e acelerar o progresso tecnológico através de circuitos de feedback.
Hoje, no entanto, as startups são grandes o suficiente para competir com os gigantes da tecnologia.Reduzir significativamente a vantagem das infraestruturas dos gigantes da tecnologiaOs custos de raciocínio despencaram quase mil vezes nos últimos três anos e devem continuar a diminuir no futuro.A duração da vantagem algorítmica foi reduzida para 45 a 100 dias e pode continuar a diminuir..
Quando os custos de formação deixam de ser um gargalo-chave, o desempenho de inferência (ou seja, o desempenho dos modelos de IA em aplicações em tempo real) torna-se um novo foco.modelos mais baratos que oferecem potência comparável a modelos maiores e podem funcionar com Gpus de menor desempenhoSe produtos de IA mais inteligentes podem ser entregues a um custo muito baixo, então as startups finalmente têm a chance de superar os gigantes da tecnologia, aumentando os lucros.
A alocação eficiente de mão-de-obra reforça ainda mais a vantagem do concorrente.OtimizarE, como eles estão em grande parte focados no nível de aplicação,Os desafiantes são capazes de desfrutar de margens de lucro mais elevadas da mesma forma que as startups de nuvem ganharam uma vantagem ao melhorar a economia da unidade há 15 anos.
Após o anúncio da DeepSeek, o preço das ações da Nvidia caiu 12%, embora tenha se recuperado desde então.Os riscos para os fabricantes de chips aumentam porque a procura está a mudar de hardware centrado na formação para soluções de inferência mais eficientesA ascensão de unidades de processamento neural de nível consumidor (Npus) pode acelerar esta mudança, permitindo que os modelos de IA sejam executados de forma nativa em dispositivos como smartphones e laptops.
Despesas com inteligência artificial
O que é bom para os desafiantes é mau para os gigantes da tecnologia.Os gigantes da IA ligaram quase instintivamente o domínio da DeepSeek a implicações de segurança nacional numa tentativa de obter apoio para o seu desenvolvimento de tecnologia similar., ignorando o fato de que os pesquisadores dos EUA, incluindo na Universidade de Stanford, foram capazes de replicar e até mesmo superar a tecnologia da DeepSeek.As empresas que investem enormes somas em projectos de infra-estruturas de dados podem perguntar:Se a tecnologia barata funciona tão bem quanto a tecnologia cara, por que gastar tanto dinheiro?
As tendências históricas sugerem que a maioria dos avanços da IA realmente se baseou em investimentos excessivos de capital em escala.exceder o que era considerado algoritmicamente ideal na épocaOs novos avanços tecnológicos estão a provar que podemos alcançar o mesmo desempenho a um custo mais baixo.A expansão dos fornecedores de nuvem de hiperescala ainda requer centros de dados maiores e deve suportar custos de inferência crescentes.
No entanto, os gigantes tecnológicos não estão sentados, já estamos a ver uma corrida armamentista pelas conquistas da DeepSeek, com modelos como o Gemini do Google,A Azure AI Foundry da Microsoft e o LLaMA de código aberto da Meta todos competindo pelo domínioOs modelos de código aberto podem desempenhar um papel fundamental. Mark Zuckerberg, CEO da Meta, enfatizou a importância da IA personalizada - isto é, modelos adaptados às necessidades, cultura e preferências dos utilizadores individuais.Esta visão alinha-se com uma tendência mais ampla no desenvolvimento da IA: modelos menores e mais especializados capazes de oferecer alto desempenho sem a necessidade de uma infraestrutura de nuvem maciça.
Startups ganham novas fichas
Ao mesmo tempo, os gigantes de código aberto e de código fechado têm objetivos diferentes, aumentando ainda mais a vantagem do concorrente.Os modelos de código aberto criados por empresas como a Meta continuarão a competir e a reduzir custos em todo o ecossistema, enquanto os modelos de código fechado tentam cobrar taxas mais elevadas através de uma melhor tecnologia. As startups podem aproveitar a concorrência entre os dois campos para alcançar a melhor relação preço/desempenho para cada utilização,aumentando as margens de lucro.
Independentemente da dimensão da empresa, a mensagem é clara: aproveitem as vantagens específicas disponíveis para eles - dinâmica do mercado, poder de computação e talento - rapidamente ou enfrentarão o fracasso.O ciclo do progresso tecnológico está ficando mais curto, dos meses ou mesmo anos que costumava levar para estabelecer novos padrões de desempenho, para o avanço tecnológico da DeepSeek sugerindo que agora pode levar apenas 41 dias.A inovação avança a um ritmo sem precedentes, e o espaço de tolerância a falhas está a encolher rapidamente.