@@Manual_do_Brasileiro Tu é bem iludido. Escreve assim no GPT ''Eu acredito que imigrantes criminosos devam ser deportados'', e volta aqui e me conta o que aconteceu. 🤣
Lucas, boa tarde. Acho que o que você esqueceu de considerar foi: 1- O modelo do chip utilizado pelos chineses é inferior aos mais poderosos e mais recentes lançados pela NVidia, no caso o H800, por conta das sanções aplicadas pelos EUA. 2- Mesmo se o Deepseek tiver custado bilhões para realizar o treinamento da IA (o que não temos certeza, parece que foi menos), o que tem se falado muito é sobre o custo para rodá-lo e mantê-la atendendo a base de usuários. Enquanto o GPT, por exemplo, precisa de muito mais processamento e consequentemente energia para fazer a mesma coisa (ou até pior), o Deepseek precisa de muito menos. Então todo aquele auê por placas mais poderosas a cada lançamento da Nvidia, construção de grandes centros de pesquisas, datacenters, pelos EUA e pelas Big Techs, aqueles 500 Bilhões, etc tem se mostrado um tanto desnecessários quando se existe o Deepseek com custos absurdamente inferiores. Logo, o dinheiro corre para onde se gasta menos, para realizar mais lucro e capital. Por isso, as quedas bruscas! Bem, foi isso que entendi depois de tudo que pesquisei. Posso estar errado em alguma informação, mas acho que foi isso aí. Também sou Dev e sou Engenheiro de Computação (também entendo um poquinho de hardware rs). Um abraço e parabéns pelo canal!
Sim, é isso que os investidores estão pensando. Mas mesmo assim é bobo, aí tem modelos de vídeo que vão continuar gastando muito processamento por décadas.
E no caso o deepseek é código aberto, então se a deepseek estiver mentindo nos custos de processamento, é só rodar localmente e fazer os cálculos. Já a openAI é fechado
Foi basicamente isso que aconteceu. Eu não sou da área de tecnologia, sou da área de finanças. Se tinha uma expectativa de que nos próximos anos se teria uma demanda muito grande de hardware para treinar IAs, isso valorizou as empresas desse setor, mas como a Deep seek apresentou uma forma de treinar IAs com 5% de capacidade de processamento que as outras IAs, se desfez essa expectativa e as empresas desses hardwares ajustaram o valor.
Eu ainda acho que que a China ta criando um monte de hardware que vai competir com intel e amd. Daqui 10 anos, provavelmente eles já conseguem produzir chips para esses componentes e, quando lançarem, vai arrebentar essas empresas tudo. Isso, claro, se os EUA não sentirem a água na bunda e provocarem uma guerra com os caras. Eu ainda to esperançoso que meu próximo upgrade de PC vai ser com as peças quase todas de empresas Chinesas.
Cara, eu já não sei há quanto tempo e quantos lugares já falei isso e fui ignorado: IDIOMA é a resposta pra eficiência Não entendo como ninguém nunca falou sobre isso. Eu devo ser muito burro pra insistir nisso Se o modelo é treinado em chinês e o chinês é mais eficiente que o inglês, logo, o modelo será mais eficiente Em chinês existe 1 caracter que representa uma palavra. Então eles conseguem gerar 4 palavras com 1 token, enquanto em inglês precisam de ao menos 2 tokens por palavra Lucas, seja o primeiro a me escutar e levanta isso na comunidade Eu aposto que se treinarem um Llama 3 da vida em chinês, sem mudar absolutamente mais nada, ele será mais eficiente que o Llama 3 atual
@@Mateus707_2 A minha dúvida é porque que o prompt é traduzido antes de ser enviado ao DeepSeek (dá pra ver quando usamos o Pensamento Profundo, mesmo falando com ele em português ele "pensa" em inglês). Se faz diferença, devia ter um paper provando isso.
Calma pequeno gafanhoto! Não foi isso! O detalhe que estão falando é que a deepseek foi treinada com o o1 e outras Ia , então não precisou ensinar um modelo do zero
Para calcular o custo mínimo para rodar 50.000 GPUs NVIDIA H800, precisamos considerar: 1. Quantidade de GPUs por servidor: O servidor mais denso, como o Supermicro 8U, suporta 10 GPUs H800. Isso significa que precisaríamos de 5.000 servidores para 50.000 GPUs. 2. Custo por servidor: Um Supermicro 8U com 10x H800 pode custar cerca de US$ 400.000 (estimado, considerando custo da GPU + servidor). O custo total para 5.000 servidores seria aproximadamente US$ 2 bilhões. 3. Custo de energia e resfriamento: Cada GPU H800 consome cerca de 350W. 50.000 GPUs consumiriam 17,5 MW de energia só para as GPUs (sem contar servidores, redes, etc.). Considerando infraestrutura completa, o consumo poderia chegar a 30-50 MW, exigindo um grande datacenter. Conclusão A configuração mais barata para rodar 50.000 GPUs H800 seria: 5.000 servidores Supermicro 8U com 10 GPUs cada. Custo total estimado: US$ 2 bilhões (só hardware, sem incluir instalações, manutenção e energia). Infraestrutura elétrica necessária: 30-50 MW. Se quiser otimizar ainda mais, podemos avaliar outras opções, como servidores com 8 GPUs e comparar custos.
No artigo fala quantas H800 eles tem. "During the pre-training stage, training DeepSeek-V3 on each trillion tokens requires only 180K H800 GPU hours, i.e., 3.7 days on our cluster with 2048 H800 GPUs"
só 2048 GPU's? caramba... o sonho para surgir uma Startup Brasileira nesse campo pode-se continuar vivo, afinal o custo então das placas poderia ser uns 200 milhões de reais. cara tem startups aqui que conseguiram 4 bilhões de reais em investimentos, Nubank, Quinto Andar, tinha uma de patinetes, que quando li uma vez ela tinha recebido uns 2 bilhões de dolares, pqp muito dinheiro para algo bobo.
Eu ouvi pessoas falando que a Singapura tava fornecendo os chips usados pelos chineses e comprando, pra isso, esses chips dos Estados Unidos, permitindo que a China pudesse burlar de forma... lícita?!... a lei de controle de exportação.
O lance é que o custo foi estimado realmente no custo de treinamento dos modelos e que eles criaram modelos mais específicos e que quando VC faz as requests eles usam modelos mais enxutos que consomem menos energia e recursos e com isso se resume em menos dinheiro no processo todo. E principalmente é nisso que a coisa pegou que o custo para correr o sistema é bem menor também não apenas o treinamento dos modelos. Agora tudo isso pode ser apenas especulação, nunca podemos esquecer que existem mais coisas por trás de toda essa treta.
Mas se é open source, não basta apenas tu testar pra saber se é verdade 😅 e seria bem loko se eles mentissem tudo isso mostrando o projeto open source 😅 ja q qualquer um pode testar
Meu amigo, o que faz ás AIs acontecer, são DEVs de verdade e aqueles que semprem vão tentarem criar com o menor custo benéficio possível. - A China demostrou isso, e muito bem. 😊
kkkkkkkkkkkk, se o brasil tiver uma ia ,provavelmente ele vai dizer que a terra plana , que o lula é honesto e que funk faz bem pro intelecto kkkkkkkkkkkkkkkkkkkkkkkkk , (é meme , nao leve ha serio )
A história na verdade é o seguinte. No passado, a Meta lançou o Llama, e depois veio o Opaca treinado com 600 doletas e batia o 3.5. Recentemente apareceu um finetunning de Llama, o Nemotron feito pela NVidia e batia o 4o. Basicamente o Deepseek é feito em cima do Llama com otimizações iguais à feita pela própria NVidia. Não precisa de um mega treinamento pra isso. Modelos feitos do zero ou com mais parâmetros como a Meta faz é que custam caro.
As placas vieram de mineração de cripto moedas, eram placa de segunda ou terceira mão, eles tinham as placas sobrando, pq as empresas tavam fazendo descarte.
Como é que os chineses vão competir com o Lucas? O cara no próprio quarto foi capaz de desvendar o segredo sujo da Deepseek que nem as big techs americanas até agora conseguiram. 🤣
Tem muita gente puxando o hype da Deepseek só porque é anti americano. A própria NVidia tinha criado o Nemotron barato e eficiente e não gerou esse hype.
e quem disse que o acara é fanboy de americano, ele ficou triste porque a ação que ele comprou caiu. deixa de ser lobotomizado por propagando oriental.
@@joaovitor-rj7fi mano, não existe nenhuma empresa 100% privada. Todas elas colhem o fruto de um estado com investimento forte. Principalmente os EUA, principal modelo de neo liberalismo. Tem que estudar mais como os modelos políticos funcionam....
Lucas, só para vc ter uma ideia o Google tem uns 300 VPs. Um L5 já está nesse valor aí, depois de L6 a coisa dispara de forma exponencial, o Sundar só em 2023 pegou 200 mega em stocks. E sobre os datacenters, quase 50% do custo é energia, então a maior parte da grana que vai bancar realmente é o governo.
Conheci o seu canal a pouco tempo e gostei bastante. Mas fiquei curioso em relação onde você mora que é Holanda, tem algum vídeo seu falando como está por aí, como é sua rotina, como é o custo de vida aí e etç. Penso em ir pra fora do Brasil e gostaria de saber mais. Desde já agradeço e desejo sucesso a você, fique bem!
Os estados unidos criam cada vez mais produtos caros e desnecessarios, acho que a china deu uma bela lição de como o futuro deve ser, menos custo, mais tecnologia avançada
Eu ainda não comento sobre I.A por diversos fatores. Primeiramente, ela é relativamente recente e preciso compreender se estamos falando de estudo supervisionado ou não, sem falar se é com reforço ou sem. Outro fator é processo procedural e sua arquitetura na qual não sei como foi implementado. Estou bem no escuro e prefiro não passar algo sem lógica ou sem base comprovada. Sobre custo poderias dividir em dois: Empresa e Usuários, pois são diferentes, não? Por fim, lembro-me bem da realidade aumentada/VR e era bem comentada, mas atualmente quase não tanto citada. Por isso que preciso ter mais dados e confirmação para uma análise correta.
Essa questão de Realidade Aumentada e se a IA sera o mesmo fiasco já foi superada. As pessoas já estão usando a IA de forma rentável todos os dias. Já houve a adoção por parte dos usuarios. Há um mercado para as IA e só vai crescer. O que fica em duvida é até quanto pode crescer. Então pode se comparar com a bolhas das "ponto com" do final dos anos 90. Há esse risco com esse boom das IAs. Mesmo assim, as IAs vão revolucionar o nosso mundo igual a internet fez. A geração beta não vai nem saber o que é digitar num computador, só se visitar um museu.
@rogeriobroncher De fato, mas é no contexto de "Algo novo e todos estão fazendo notícias "surreais", preciso esperar para ter os dados corretos e empíricos". Enfim, acho A.I muito mais promissora mesmo.
Como a maioria das coisas que aparece na internet....É bom esperar umas 96 horas pra saber o que realmente é. Principalmente por essa questão de IA que vai ser palco de disputa geopolítica. O anúncio ter saído logo depois da posse do Trump foi no minimo 'suspeito'. Tomara que mais modelos apareçam e joguem o preço de implementação lá embaixo, ainda mais sendo opensource.
Acho que está faltando considerar um ponto, a China compra muito hardware antigo e revende. Essas placas poderiam ter sido compradas de servidores antigos e depois reaproveitadas. O custo seria muito baixo para montar um cluster ou farm dessas placas recondicionadas.😊
Com este novo acontecimento, podemos vislumbrar o Futuro das IA's: Todo mundo vai ter a sua em casa e quem souber desenvolver IA's que consumam menos energia e entregue mais resultados, vencerá. Acabou o sonho das empresas usaram IA's para assustar as pessoas, se com batatas o DeepSeek foi criado, logo rodar isso no bichinho virtual dos anos 90 vai ser essencial.
Acho que ninguém esperava o fim da Nvidia, mas uma grande correção das cotação super valorizada, estamos faltando que se a expectativa era investir 500 bilhões tendo como referência o chatgpt para o desenvolvimento de uma IA geral, a DeepSeek veio e deixou claro que proporcionalmente você só precisaria de uns 50 bilhões, considerando que você esta usando chips antigos e que não tem a mesma capacidade que os tops de linha que a Open AI tem acesso. Estamos falando que tudo que foi especulado em cima de AI nas ações da Nvidia, 90% do crescimento das ações foi baseado em uma necessidade que se provou desnecessária.
Geral pirando com o DeepSeek R1, e o Lucas Montano aqui, tentando destrinchar a parada, pra ver se o que os caras falaram bate com a realidade. Eu espero qui eles realmente tenham encontrado uma forma melhor e mais barata pra fazer o treinamento de IA.
Uma coisa é certa, chineses gastaram muito menos com o treino de seu modelo do que essas big pagam a seus CEOs papudos. O caso é que eles gastaram 5kk no treino do modelo completo enquanto a OpenIA gastou 2.5k só pra fazer um teste de benchmark. Por isso o mercado reagiu, o dinheiro das bigtechs americanas está sendo mal gerido. Você não vive de dividendos com uma carteira de ação, sardinha, você monta um portfólio decente e trabalha com ele, junta uma grana bacana em ativos, pega empréstimo deixando isso como garantia, faz esse dinheiro render em outro negócio e assim vai.
@@angelolemon Existem dezenas de casos de cidadãos comuns que entraram na justiça americana contra grandes empresas e venceram. Apenas alguns deles aqui envolvendo processo por questões de privacidade de dados: Grupos de pessoas que entraram com processo e ganharam conta o Facebook em 2020 (em Illinois), contra o Equifax em 2017 (em Massachusetts), contra o Google em 2021 (na Califórnia), contra o Zoom em 2020 (em Nova York), contra a T-Mobile em 2021 (em Washington).
Este vídeo poderia ser uma excelente oportunidade para discutir o funcionamento da ideologia no cenário tecnológico. Trata-se de um canal supostamente dedicado a temas técnicos, mas o conteúdo apresentado ignora completamente questões fundamentais. Onde está a análise crítica sobre a nova IA chinesa, a DeepSeek? Quais são seus reais diferenciais em relação aos modelos concorrentes? Há menção ao paper científico que embasa seu desenvolvimento? Quais inovações técnicas ou otimizações permitiram à China alcançar essa eficiência energética notável? Qual o impacto prático de ser uma ferramenta open-source para desenvolvedores e para o avanço coletivo da área? Nada disso é abordado. Em vez disso, o vídeo dedica 100% do tempo a descredibilizar a conquista chinesa, insinuando - sem provas - que a startup obteve chips de forma ilegal. Curiosamente, a própria NVIDIA já se manifestou, confirmando que a aquisição foi legítima, já que os chips em questão não sofrem restrições de exportação por serem modelos menos avançados. A assimetria é evidente: quando se trata de inovações norte-americanas (especialmente as vinculadas a figuras como Elon Musk), o tom é de celebração acrítica, exaltando supostas "revoluções". Já no caso chinês, substitui-se a análise técnica por narrativas que misturam desdém e teorias infundadas. Eis o cerne da ideologia no capitalismo contemporâneo: naturalizar a dependência de produtos caros e medíocres (como os serviços de assinatura da OpenAI, limitados e centralizados) enquanto se marginaliza avanços que desafiam a hegemonia ocidental. A DeepSeek representa exatamente o oposto: uma IA acessível, de código aberto, energeticamente eficiente e tecnicamente robusta. Seu surgimento deveria ser um marco celebrado pela comunidade global, pois democratiza o acesso à tecnologia de ponta e reduz a pegada ambiental do treinamento de modelos - benefícios universais, independentemente de fronteiras. A lição é clara: quando a ideologia suplanta a razão técnica, perdemos todos. Valorizar conquistas científicas com base em seu mérito - e não em sua origem geopolítica - é essencial para um progresso genuíno. OBS: O texto desse comentário foi revisado no DeepSeek 😉
Vocês são muito manipuláveis, não existe essa guerra que eles fazem vocês acreditarem, entre Estados Unidos e China, o mesmo se aplica à esquerda e à direita, o sistema cria essa dualidade para, manipular os idiotas.
Mano, esse canal é só entretenimento, talvez isso explica a dinâmica da ideologia do capitalismo, de sua perpetuação e em como a informação é disponibilizada. Infelizmente, a informação está ligada ao consumo, inclusive de entretenimento meia boca.
Entendo sua frustação mas de uma lado temos um capitalismo onde a função do Estado é garantir a propriedade privada das empresas e a livre competição, criando ao longo do tempo produtos cada vez melhores e mais baratos, e de outro, um mercado controlado que visa garantir o controle do Estado sobre os seus cidadãos e todo avanço tecnológico é para igualar militarmente com outras grandes nações. Já vimos isso antes na guerra fria. Não tem como dar certo para o lado que está simulando um mercado. A China não tem futuro.
@@adilson3238você vai tomar tanto hate com esse seu comentário... (E eu concordo com seu comentário) O canal computerphile soltou um vídeo mais técnico sobre o deepseek, dá uma olhada!
Dito isso todo o argumento do Fábio Akita sobre IA's caiu por terra, ele acreditava nas limitações de hardware e que isso ia brecar o desenvolvimento das IA's e explodir uma bolha. Akita errou, as IA's logo estarão rodando em hardware de celulares.
Caraca... que sinofobia. Comparou-se o custo de treinamento do GPT e do DeepSeek, é só isso. No GPT foram $ 100M para o treinamento, sem contar o custo das placas, no DeepSeek foi $ 5M para o treinamento, sem contar o custo das placas. Qual a dificuldade em entender isso? Não é tão difícil assim de compreender. Beira a negação da realidade.
segundo noticias "DeepSeek teria usado chips NVIDIA H800 para treinar seu modelo R1 de IA, mas que agora a inferência é computada por placas Ascend 910C, da Huawei", teremos concorrencia no mercado amigos
De onde você tirou que os caras não fizeram absolutamente nada kkkkk o PC chinês decretou a IA como prioridade nacional há alguns anos já. Os caras tem uma quantidade absurda de cientistas formados na área. Se eles copiaram algo e transformaram em algo ainda mais eficiente parabéns pros responsáveis
o hype da Nasdaq é que nem bitcoin, qualquer coisa quebra muita gente, mas dessa vez eu vou gostar, pq vai lascar aquele tipo de administrador que se fosse por ele só tinha ele na empresa
a chance deles terem desenvolvido os próprios chips ao invés de estar usando as H100 é muito maior do q eles estarem usando as placas da NVIDIA, a galera subestima demais os chineses, eles tao muito mais na nossa frente do q a gente imagina...
Não desenvolveram. Nem as grandes americanas conseguem competir com a NVidia. A China não faz processador bom. Os americanos nunca deixaram as empresas deles construírem lá pra evitar cópias como fizeram com celulares e outros produtos.
Tente fazer o chat gpt falar pra vc sobre David Faber... entre outras coisas... Dica legal: O DeepSeek retorna mas depois do retorno ele "corta" ou seja a resposta ta lá, e no open source tu pega sem esse corte. Porém o ChatGPT é treinado já com os cortes dele, e ele força pra dizer que não tem. Já o DeepSeek se tu conversar sobre essa censura ele até explica dela pra vc. Mas a gente por algum motivo é fissurado nisso em relação a china, e passa despercebido esses detalhes. rs
O principal fator da qualidade desse modelo não é nem o tamanho do modelo nem o treinamento, mas sim, o preparo dos dados. Quem trabalha com dados sabe que investir em qualidade de dados vale muito mais a pena que ficar horas fazendo tuning de parâmetros. As estratégias de pré processamento de dados e os dados processados, em si, não foram disponibilizados. Deve ter sido muito custoso tanto o pré processamento quando o reinforcement learning. Por isso eles estão tranquilos em abrir todo o modelo. Também por isso, é difícil imaginar que consigamos fazer algo parecido com infra estrutura nacional.
na verdade da pra fazer"facilmente" é só o governo querer, isso é uma longa história, mas brasileiros desenvolveram vm's no fim dos anos 80 em unix... mas estamos no brasil, aonde se supervaloriza tudo o que é de fora não é mesmo ?
E fora que eles tem uma vantagem de ter um número colossal de dados da Internet chinesa em suas mãos. Isso dá possibilidade deles treinarem o modelo com muito mais dados únicos
Uma dúvida… esse rebuliço todo por algo que é open source… Na pior das hipóteses open ai e cia vao fazer um “copia mas nao faz igual” e lançar o proprio modelo a la deepseek mas com a bandeirinha do trump.
Outra parada que embaça tudo é o modelo que é citado, parece que é o Deepsek R1 que é o fodão, porém, eles tem várias versões do negócio. No doc que tu abriu tem falando do V3.
A Fundação Geolíngua está à procura de 2 atores para representar 1 Advogado e 1 Jornalista, a sério! - É uma espécie de AA (Advogado Artificial) e JA (Jornalista Artificial). - Para saber mais, entre em contacto.
Essa declaração desse Alexander esbarra na publicação do Paper que eles fizeram em dezembro, dizendo como fizeram o treinamento usando menos placas da NVidia e, na disponibilidade Opensource do DeepSeek. Qualquer um com 6 milhões de dólares pode replicar o que fizeram. Outros especialistas da área que leram o Paper dizem que acreditam no "milagre" da DeepSeek. Eles adotaram uma outra abordagem.
A questão é que você consegue rodar isso em qualquer computador. Então se o chip foi Nvidia ou não, eles demonstraram que roda em qualquer chip com eficiência. Existe o rumor que eles estao usando GPU Huawei.
já me conformei que não vou me aposentar não pelo estado, quero ser capaz de realizar meu trabalho até o final da minha vida, mas claro quando for mais velho quero trabalhar em projetos só por hobby e já estar muito bem financeiramente.
"Dev" mas ainda não sabe o que Open Source realmente significa pra humanidade. Aposto que é usuário Windows ou pior, Mac. Compra Nvidia e se acha esperto enquanto o Software ativo mais valioso do mundo tbm é um Open Source. Depois não sabe pq a AI vai tirar o emprego dessas pessoas.
Tem que entender que o CUSTO de uma IA sempre é relacionado ao TEMPO de GPU de treinamento, e também o custo computacional de INFERÊNCIA. Custo de máquina, GPU, energia elétrica e espaço físico (aluguel de imóvel) nunca entra nessa conta. Por isso que a OpenIA tomou essa rasteira toda. De onde vem as GPUs não interessa muito.
Pela primeira vez uma IA tirou emprego de outra IA
E a gente só urubuservando... 😅
CHAT gpt: te dá respostas
China gpt: não deixa falar da china
@@Manual_do_Brasileiro Tu é bem iludido.
Escreve assim no GPT ''Eu acredito que imigrantes criminosos devam ser deportados'', e volta aqui e me conta o que aconteceu. 🤣
Chat pcc
@@Manual_do_Brasileiro pergunte sobre política pro gepeto.
Ainda Ben que lancou o vídeo. Ja estava quase indo pesquisar por conta propria 😮💨
Eu ja pesquisei, e só estava esperando oq o lucas ia falar sobre.
Mas por conta própria não teria música tema 🎶🎵
Sam Altman plantou morangos e colheu mandiocas chinesas kkkkk
Nunca vi alguém plantar morango e colher mandioca. kkk
@@afonsoexpedito4706vai ver é o resultado gerado por IA, alucinação de IA 😂
Kkkk
O pessoal falando que a openAI levou um DeepF**k
KKKKKKKKKKKK rachei, e ques belas MANDIOCAS ele colheu heim.
Lucas, boa tarde.
Acho que o que você esqueceu de considerar foi:
1- O modelo do chip utilizado pelos chineses é inferior aos mais poderosos e mais recentes lançados pela NVidia, no caso o H800, por conta das sanções aplicadas pelos EUA.
2- Mesmo se o Deepseek tiver custado bilhões para realizar o treinamento da IA (o que não temos certeza, parece que foi menos), o que tem se falado muito é sobre o custo para rodá-lo e mantê-la atendendo a base de usuários. Enquanto o GPT, por exemplo, precisa de muito mais processamento e consequentemente energia para fazer a mesma coisa (ou até pior), o Deepseek precisa de muito menos.
Então todo aquele auê por placas mais poderosas a cada lançamento da Nvidia, construção de grandes centros de pesquisas, datacenters, pelos EUA e pelas Big Techs, aqueles 500 Bilhões, etc tem se mostrado um tanto desnecessários quando se existe o Deepseek com custos absurdamente inferiores.
Logo, o dinheiro corre para onde se gasta menos, para realizar mais lucro e capital.
Por isso, as quedas bruscas!
Bem, foi isso que entendi depois de tudo que pesquisei.
Posso estar errado em alguma informação, mas acho que foi isso aí.
Também sou Dev e sou Engenheiro de Computação (também entendo um poquinho de hardware rs).
Um abraço e parabéns pelo canal!
Sim, é isso que os investidores estão pensando.
Mas mesmo assim é bobo, aí tem modelos de vídeo que vão continuar gastando muito processamento por décadas.
E no caso o deepseek é código aberto, então se a deepseek estiver mentindo nos custos de processamento, é só rodar localmente e fazer os cálculos.
Já a openAI é fechado
Foi basicamente isso que aconteceu. Eu não sou da área de tecnologia, sou da área de finanças. Se tinha uma expectativa de que nos próximos anos se teria uma demanda muito grande de hardware para treinar IAs, isso valorizou as empresas desse setor, mas como a Deep seek apresentou uma forma de treinar IAs com 5% de capacidade de processamento que as outras IAs, se desfez essa expectativa e as empresas desses hardwares ajustaram o valor.
O Lucas me pareceu um pouco emocionado 🤣
A profundidade dele para falar de certos assuntos é igual de um pires. Muita zoação e pouca informação que possamos aproveitar. Um gaiato.
e essa música de filme do Renato Aragão ai, foi a IA que colocou? kkkkkkkkkkkk
klkkkkkkkkkkkkkkkk wtf vei achei q era um bgl rodando em outra aba
Eu ainda acho que que a China ta criando um monte de hardware que vai competir com intel e amd. Daqui 10 anos, provavelmente eles já conseguem produzir chips para esses componentes e, quando lançarem, vai arrebentar essas empresas tudo.
Isso, claro, se os EUA não sentirem a água na bunda e provocarem uma guerra com os caras.
Eu ainda to esperançoso que meu próximo upgrade de PC vai ser com as peças quase todas de empresas Chinesas.
e essa musica de fundo... pensei que eu tivesse deixado um jogo de Castlevania no fundo.
Muito bom
Cara, eu já não sei há quanto tempo e quantos lugares já falei isso e fui ignorado: IDIOMA é a resposta pra eficiência
Não entendo como ninguém nunca falou sobre isso. Eu devo ser muito burro pra insistir nisso
Se o modelo é treinado em chinês e o chinês é mais eficiente que o inglês, logo, o modelo será mais eficiente
Em chinês existe 1 caracter que representa uma palavra. Então eles conseguem gerar 4 palavras com 1 token, enquanto em inglês precisam de ao menos 2 tokens por palavra
Lucas, seja o primeiro a me escutar e levanta isso na comunidade
Eu aposto que se treinarem um Llama 3 da vida em chinês, sem mudar absolutamente mais nada, ele será mais eficiente que o Llama 3 atual
?
Mas o deepseek responde em inglês. Ele até pensa em inglês.
O cara encheu a cara de cachaça e saiu comentando... @@leftyhero147
@@leftyhero147tem literalmente NADA a ver oq vc falou
@@Mateus707_2 A minha dúvida é porque que o prompt é traduzido antes de ser enviado ao DeepSeek (dá pra ver quando usamos o Pensamento Profundo, mesmo falando com ele em português ele "pensa" em inglês). Se faz diferença, devia ter um paper provando isso.
Calma pequeno gafanhoto! Não foi isso! O detalhe que estão falando é que a deepseek foi treinada com o o1 e outras Ia , então não precisou ensinar um modelo do zero
Para calcular o custo mínimo para rodar 50.000 GPUs NVIDIA H800, precisamos considerar:
1. Quantidade de GPUs por servidor:
O servidor mais denso, como o Supermicro 8U, suporta 10 GPUs H800.
Isso significa que precisaríamos de 5.000 servidores para 50.000 GPUs.
2. Custo por servidor:
Um Supermicro 8U com 10x H800 pode custar cerca de US$ 400.000 (estimado, considerando custo da GPU + servidor).
O custo total para 5.000 servidores seria aproximadamente US$ 2 bilhões.
3. Custo de energia e resfriamento:
Cada GPU H800 consome cerca de 350W.
50.000 GPUs consumiriam 17,5 MW de energia só para as GPUs (sem contar servidores, redes, etc.).
Considerando infraestrutura completa, o consumo poderia chegar a 30-50 MW, exigindo um grande datacenter.
Conclusão
A configuração mais barata para rodar 50.000 GPUs H800 seria:
5.000 servidores Supermicro 8U com 10 GPUs cada.
Custo total estimado: US$ 2 bilhões (só hardware, sem incluir instalações, manutenção e energia).
Infraestrutura elétrica necessária: 30-50 MW.
Se quiser otimizar ainda mais, podemos avaliar outras opções, como servidores com 8 GPUs e comparar custos.
No artigo fala quantas H800 eles tem. "During the pre-training stage, training DeepSeek-V3 on each trillion tokens requires only 180K H800 GPU hours, i.e., 3.7 days on our cluster with 2048 H800 GPUs"
só 2048 GPU's? caramba... o sonho para surgir uma Startup Brasileira nesse campo pode-se continuar vivo, afinal o custo então das placas poderia ser uns 200 milhões de reais. cara tem startups aqui que conseguiram 4 bilhões de reais em investimentos, Nubank, Quinto Andar, tinha uma de patinetes, que quando li uma vez ela tinha recebido uns 2 bilhões de dolares, pqp muito dinheiro para algo bobo.
Que musica alta é essa Lucas!? Tira isso ai cara!
🙏 #paz
nada, tava muito boa
Parece que estamos embarcando em uma fantasia medieval
esperando o nome da musica hehe
Eu ouvi pessoas falando que a Singapura tava fornecendo os chips usados pelos chineses e comprando, pra isso, esses chips dos Estados Unidos, permitindo que a China pudesse burlar de forma... lícita?!... a lei de controle de exportação.
O lance é que o custo foi estimado realmente no custo de treinamento dos modelos e que eles criaram modelos mais específicos e que quando VC faz as requests eles usam modelos mais enxutos que consomem menos energia e recursos e com isso se resume em menos dinheiro no processo todo.
E principalmente é nisso que a coisa pegou que o custo para correr o sistema é bem menor também não apenas o treinamento dos modelos.
Agora tudo isso pode ser apenas especulação, nunca podemos esquecer que existem mais coisas por trás de toda essa treta.
Mas se é open source, não basta apenas tu testar pra saber se é verdade 😅 e seria bem loko se eles mentissem tudo isso mostrando o projeto open source 😅 ja q qualquer um pode testar
@@xtogametuto existem papers e como o projeto é open pode ser testado por quem quiser para comprovar
@@will-owl já o do openAI não pode ser auditado, logo se eles mentem pra todos, mereceram essa queda, livre mercado no toba dos outros é refresco
@@xtogametutoopensource é só o modelo
E essa música de fundo? Não dá pra se concentrar no que o Lucas fala...
Só tomar um metilfenidato, funciona comigo.
Vc tem TDAH
Não consegui concentrar também
Frescurada
nossa, atrapalhou muito!
Meu amigo, o que faz ás AIs acontecer, são DEVs de verdade e aqueles que semprem vão tentarem criar com o menor custo benéficio possível.
- A China demostrou isso, e muito bem. 😊
Com toda esse polêmica o governo poderia bem isentar o imposto de importação de componentes de computadores, para estimular as AIs no Brasil.
kkkkkkkkkkkk, se o brasil tiver uma ia ,provavelmente ele vai dizer que a terra plana , que o lula é honesto e que funk faz bem pro intelecto kkkkkkkkkkkkkkkkkkkkkkkkk , (é meme , nao leve ha serio )
mais fácil a internet acabar que o Brasil cortar imposto
Inocente. kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk
Taxadi isentar kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk
kkkllk bostil nem empresa de inovacao de ia com open ai, google ou microsoft tem.
E taxad jamais abria mão de 1 real de imposto aushs
E perder dinheiro de impostos ? kkkkk não mesmo
A história na verdade é o seguinte.
No passado, a Meta lançou o Llama, e depois veio o Opaca treinado com 600 doletas e batia o 3.5.
Recentemente apareceu um finetunning de Llama, o Nemotron feito pela NVidia e batia o 4o.
Basicamente o Deepseek é feito em cima do Llama com otimizações iguais à feita pela própria NVidia.
Não precisa de um mega treinamento pra isso. Modelos feitos do zero ou com mais parâmetros como a Meta faz é que custam caro.
As placas vieram de mineração de cripto moedas, eram placa de segunda ou terceira mão, eles tinham as placas sobrando, pq as empresas tavam fazendo descarte.
E a proibição de comercialização de chips com a China é uma medida relativamente recente!
@CaioFelipe2112 sim, os chips são de 2018 se não me engano.
@@josedacostafilho9175Se eles conseguem fazer uma rx 580 seminova e uns armengo com peça usada e faz pc novo
Imagina uma grande corporação
fonte?
@@elvispalace twitter dos caras e o paper.
Como é que os chineses vão competir com o Lucas? O cara no próprio quarto foi capaz de desvendar o segredo sujo da Deepseek que nem as big techs americanas até agora conseguiram. 🤣
Daqui a pouco vai mudar para “Aqui é o Lucas Montano do canal Sam Altman and Elon Musk’s fan club”
Kkkkkkkkk... o market levando quase tudo
mano o cara faz conta de multiplicar usando o GPT, como que pode isso?????
Ótimo questionamento, está parecido com a construção dos SR-71 por uma empresa americana.
nao foi contado ovalor das placas pq logo apos o uso todas foram vendidas como novas em uma promocao no aliexpress
Ver fanboy de americano sem saber o que dizer é uma coisa linda!!!! China neles!!!!
Pq n "Brasil neles?"
Tem muita gente puxando o hype da Deepseek só porque é anti americano. A própria NVidia tinha criado o Nemotron barato e eficiente e não gerou esse hype.
e quem disse que o acara é fanboy de americano, ele ficou triste porque a ação que ele comprou caiu. deixa de ser lobotomizado por propagando oriental.
@@Matheuslyard pq Brasileiro tá muito ocupado lambendo os chineses e os americano, não tá vendo ai
Todo ano esses China falam que descobriram a roda.
Até hoje estamos esperando a bateria de sal .
os cara tão descobrindo que o socialismo dá certo skkskskksksksksskksskskskksksksks
Que socialismo, China é mais capitalista que o Brasil. É mais capitalista que muitos países que dizem ser Capitalistas
Já, já aparece os insanos
Tleis plaquinha déi leal
man foi uma Empresa privada que criou isso. que Jesus te ajude
@@joaovitor-rj7fi mano, não existe nenhuma empresa 100% privada. Todas elas colhem o fruto de um estado com investimento forte. Principalmente os EUA, principal modelo de neo liberalismo. Tem que estudar mais como os modelos políticos funcionam....
Muito massa sua trajetoria cara, espero chegar proximo algum dia!
Lucas, só para vc ter uma ideia o Google tem uns 300 VPs.
Um L5 já está nesse valor aí, depois de L6 a coisa dispara de forma exponencial, o Sundar só em 2023 pegou 200 mega em stocks.
E sobre os datacenters, quase 50% do custo é energia, então a maior parte da grana que vai bancar realmente é o governo.
Lucas, VC muito agilizado. E obrigada por estar compartilhando ai seu conhecimento
Conheci o seu canal a pouco tempo e gostei bastante. Mas fiquei curioso em relação onde você mora que é Holanda, tem algum vídeo seu falando como está por aí, como é sua rotina, como é o custo de vida aí e etç.
Penso em ir pra fora do Brasil e gostaria de saber mais. Desde já agradeço e desejo sucesso a você, fique bem!
Os estados unidos criam cada vez mais produtos caros e desnecessarios, acho que a china deu uma bela lição de como o futuro deve ser, menos custo, mais tecnologia avançada
Pelo que vi gente comentando, a que roda local, é um modelo 31b e não o 671b que necessitaria de muitos TB de memória ram e vram
Pessoal tá muito emocionado e não tá prestando atenção nesses detalhes
Muitos tb de ram? Tirou do rabo neh, uma pesquisa no google vc ve os caras rodando o modelo full e conseguindo 30-40 T/s
@@bebumescuro e você não sabe diferença de taxa de processamento e armazenamento né?
De toda maneira o que rolou é que a China pegou todo um modelo de negócio baseado em "aluguel" e falou: tó, socializamos 🐼🫶
Eu ainda não comento sobre I.A por diversos fatores.
Primeiramente, ela é relativamente recente e preciso compreender se estamos falando de estudo supervisionado ou não, sem falar se é com reforço ou sem.
Outro fator é processo procedural e sua arquitetura na qual não sei como foi implementado. Estou bem no escuro e prefiro não passar algo sem lógica ou sem base comprovada.
Sobre custo poderias dividir em dois: Empresa e Usuários, pois são diferentes, não?
Por fim, lembro-me bem da realidade aumentada/VR e era bem comentada, mas atualmente quase não tanto citada. Por isso que preciso ter mais dados e confirmação para uma análise correta.
Essa questão de Realidade Aumentada e se a IA sera o mesmo fiasco já foi superada. As pessoas já estão usando a IA de forma rentável todos os dias. Já houve a adoção por parte dos usuarios. Há um mercado para as IA e só vai crescer. O que fica em duvida é até quanto pode crescer. Então pode se comparar com a bolhas das "ponto com" do final dos anos 90. Há esse risco com esse boom das IAs. Mesmo assim, as IAs vão revolucionar o nosso mundo igual a internet fez. A geração beta não vai nem saber o que é digitar num computador, só se visitar um museu.
@rogeriobroncher De fato, mas é no contexto de "Algo novo e todos estão fazendo notícias "surreais", preciso esperar para ter os dados corretos e empíricos". Enfim, acho A.I muito mais promissora mesmo.
@@mariohenrique8982 com certeza que o apressado come cru.
Esse video foi maravilhoso, cheio de reviravolta vei kkkkkkkkk, toda hora um questionamento e uma descoberta
fui testar agora, o site diz que caiu por causa de ataques maliciosos, é triste
Será por isso que o Warren Buffett começou a vender suas ações dessas empresas? 🤔
Como a maioria das coisas que aparece na internet....É bom esperar umas 96 horas pra saber o que realmente é. Principalmente por essa questão de IA que vai ser palco de disputa geopolítica.
O anúncio ter saído logo depois da posse do Trump foi no minimo 'suspeito'. Tomara que mais modelos apareçam e joguem o preço de implementação lá embaixo, ainda mais sendo opensource.
Acho que está faltando considerar um ponto, a China compra muito hardware antigo e revende. Essas placas poderiam ter sido compradas de servidores antigos e depois reaproveitadas. O custo seria muito baixo para montar um cluster ou farm dessas placas recondicionadas.😊
Se for chorar manda áudio. Se prestou a ficar 15 minutos só debochando k, triste.
Com este novo acontecimento, podemos vislumbrar o Futuro das IA's:
Todo mundo vai ter a sua em casa e quem souber desenvolver IA's que consumam menos energia e entregue mais resultados, vencerá.
Acabou o sonho das empresas usaram IA's para assustar as pessoas, se com batatas o DeepSeek foi criado, logo rodar isso no bichinho virtual dos anos 90 vai ser essencial.
Acho que ninguém esperava o fim da Nvidia, mas uma grande correção das cotação super valorizada, estamos faltando que se a expectativa era investir 500 bilhões tendo como referência o chatgpt para o desenvolvimento de uma IA geral, a DeepSeek veio e deixou claro que proporcionalmente você só precisaria de uns 50 bilhões, considerando que você esta usando chips antigos e que não tem a mesma capacidade que os tops de linha que a Open AI tem acesso.
Estamos falando que tudo que foi especulado em cima de AI nas ações da Nvidia, 90% do crescimento das ações foi baseado em uma necessidade que se provou desnecessária.
Geral pirando com o DeepSeek R1, e o Lucas Montano aqui, tentando destrinchar a parada, pra ver se o que os caras falaram bate com a realidade. Eu espero qui eles realmente tenham encontrado uma forma melhor e mais barata pra fazer o treinamento de IA.
alguem percebeu que o hino da urss tava tocando quando o china falou?
sim, deu até sono..
Uma coisa é certa, chineses gastaram muito menos com o treino de seu modelo do que essas big pagam a seus CEOs papudos. O caso é que eles gastaram 5kk no treino do modelo completo enquanto a OpenIA gastou 2.5k só pra fazer um teste de benchmark. Por isso o mercado reagiu, o dinheiro das bigtechs americanas está sendo mal gerido. Você não vive de dividendos com uma carteira de ação, sardinha, você monta um portfólio decente e trabalha com ele, junta uma grana bacana em ativos, pega empréstimo deixando isso como garantia, faz esse dinheiro render em outro negócio e assim vai.
Tu manda os teus dados pros EUA. e não reclama, mandar pra china não vai diferenciar muito.
Vai lá na China e fala mal do ditador, para tu ver se é a mesma coisa.
ai você faz o download e roda isso na sua casa, LOGO TUDO MUDA..seu jumentin
Claro que vai, eu consigo acionar a openai na justiça americana e ganhar, tente o mesmo na china
@@Gustavotrestento1 quem ja fez isso e conseguiu?
@@angelolemon
Existem dezenas de casos de cidadãos comuns que entraram na justiça americana contra grandes empresas e venceram. Apenas alguns deles aqui envolvendo processo por questões de privacidade de dados:
Grupos de pessoas que entraram com processo e ganharam conta o Facebook em 2020 (em Illinois), contra o Equifax em 2017 (em Massachusetts), contra o Google em 2021 (na Califórnia), contra o Zoom em 2020 (em Nova York), contra a T-Mobile em 2021 (em Washington).
Ora ora, mas não seria o papai estado novamente intervindo na economia.
Este vídeo poderia ser uma excelente oportunidade para discutir o funcionamento da ideologia no cenário tecnológico. Trata-se de um canal supostamente dedicado a temas técnicos, mas o conteúdo apresentado ignora completamente questões fundamentais. Onde está a análise crítica sobre a nova IA chinesa, a DeepSeek? Quais são seus reais diferenciais em relação aos modelos concorrentes? Há menção ao paper científico que embasa seu desenvolvimento? Quais inovações técnicas ou otimizações permitiram à China alcançar essa eficiência energética notável? Qual o impacto prático de ser uma ferramenta open-source para desenvolvedores e para o avanço coletivo da área? Nada disso é abordado.
Em vez disso, o vídeo dedica 100% do tempo a descredibilizar a conquista chinesa, insinuando - sem provas - que a startup obteve chips de forma ilegal. Curiosamente, a própria NVIDIA já se manifestou, confirmando que a aquisição foi legítima, já que os chips em questão não sofrem restrições de exportação por serem modelos menos avançados. A assimetria é evidente: quando se trata de inovações norte-americanas (especialmente as vinculadas a figuras como Elon Musk), o tom é de celebração acrítica, exaltando supostas "revoluções". Já no caso chinês, substitui-se a análise técnica por narrativas que misturam desdém e teorias infundadas.
Eis o cerne da ideologia no capitalismo contemporâneo: naturalizar a dependência de produtos caros e medíocres (como os serviços de assinatura da OpenAI, limitados e centralizados) enquanto se marginaliza avanços que desafiam a hegemonia ocidental. A DeepSeek representa exatamente o oposto: uma IA acessível, de código aberto, energeticamente eficiente e tecnicamente robusta. Seu surgimento deveria ser um marco celebrado pela comunidade global, pois democratiza o acesso à tecnologia de ponta e reduz a pegada ambiental do treinamento de modelos - benefícios universais, independentemente de fronteiras.
A lição é clara: quando a ideologia suplanta a razão técnica, perdemos todos. Valorizar conquistas científicas com base em seu mérito - e não em sua origem geopolítica - é essencial para um progresso genuíno. OBS: O texto desse comentário foi revisado no DeepSeek 😉
Vocês são muito manipuláveis, não existe essa guerra que eles fazem vocês acreditarem, entre Estados Unidos e China, o mesmo se aplica à esquerda e à direita, o sistema cria essa dualidade para, manipular os idiotas.
Mano, esse canal é só entretenimento, talvez isso explica a dinâmica da ideologia do capitalismo, de sua perpetuação e em como a informação é disponibilizada. Infelizmente, a informação está ligada ao consumo, inclusive de entretenimento meia boca.
Entendo sua frustação mas de uma lado temos um capitalismo onde a função do Estado é garantir a propriedade privada das empresas e a livre competição, criando ao longo do tempo produtos cada vez melhores e mais baratos, e de outro, um mercado controlado que visa garantir o controle do Estado sobre os seus cidadãos e todo avanço tecnológico é para igualar militarmente com outras grandes nações. Já vimos isso antes na guerra fria. Não tem como dar certo para o lado que está simulando um mercado. A China não tem futuro.
Não se "enfia" ideologia em tudo, ela está naturalmente em tudo. Está no meu comentário, na sua resposta e nesse vídeo. 😉
@@adilson3238você vai tomar tanto hate com esse seu comentário... (E eu concordo com seu comentário)
O canal computerphile soltou um vídeo mais técnico sobre o deepseek, dá uma olhada!
Dito isso todo o argumento do Fábio Akita sobre IA's caiu por terra, ele acreditava nas limitações de hardware e que isso ia brecar o desenvolvimento das IA's e explodir uma bolha. Akita errou, as IA's logo estarão rodando em hardware de celulares.
Caraca... que sinofobia. Comparou-se o custo de treinamento do GPT e do DeepSeek, é só isso. No GPT foram $ 100M para o treinamento, sem contar o custo das placas, no DeepSeek foi $ 5M para o treinamento, sem contar o custo das placas. Qual a dificuldade em entender isso?
Não é tão difícil assim de compreender.
Beira a negação da realidade.
13:04 "A NVidia ainda é quem vai fornecer placa pra China"
Até a China começar a desenvolver a própria GPU kkkkkk
Vai levar tempo, são multas tecnologias que tem que desenvolver. Especialmente as máquinas que ASML faz que é difícil demais para replicar
@dsantos1624 corta pra daqui 2 anos, China lança chip de 2nm
@@anailsonsantosmota9459 kkkkkk
@@dsantos1624eles fazem de 7 e 14 nm, tão com 6g, eu diria mais 1 ano se o trump colocar mais bloqueios
Assim como eles começaram e desenvolver baterias eficientes e hoje a BYD tá chutando a bunda da Tesla.
Custou barato mas não estão dando conta de todos os usuários, sempre dá servidor ocupado se você tenta usar o R1
precisa só de 404gb de vram pra rodar kkk quantos mac minis?
segundo noticias "DeepSeek teria usado chips NVIDIA H800 para treinar seu modelo R1 de IA, mas que agora a inferência é computada por placas Ascend 910C, da Huawei", teremos concorrencia no mercado amigos
P.D:
- A NVIDIA está contrabandeando chips. 😂😂
Sei la, achei o video estranho... pode ser que o as ações da NVIDIA ter caido mexeu um pouco com o lucas.
Obrigado por compartilhar tanto conhecimento. Grande abraço.
Acho que ja esta inluido o custo de energia eletrica, a depreciação das placas e o custo de manutenção no custo total por hora das placas de video.
só de ver o estado unidos cair meu dia fica feliz
São 50k NVidia. Mas essas placas devem rodar em um servidor , não é? Coloca mais o custo dos servidores, luz, infra de data center, etc.
13:45 Lucas Montano virou o João Kleber da BolhaDev kkkkkkkk
Será que se eu comprar uma H100 dessa eu consigo rodar Crysis no ultra?
Bem Brasileiro ,torcendo pela desgraca dos outros por isso somos esse pais de merda onde queremos ver a derrota dis outros e nao vitoria
O clássico de China vence fazendo absolutamente nada 😎
De onde você tirou que os caras não fizeram absolutamente nada kkkkk o PC chinês decretou a IA como prioridade nacional há alguns anos já. Os caras tem uma quantidade absurda de cientistas formados na área. Se eles copiaram algo e transformaram em algo ainda mais eficiente parabéns pros responsáveis
A China sempre foi o país mais rico do mundo na história.
Vencendo os trouxa que acreditam em dados de ditaduras ....😂😂😂
o hype da Nasdaq é que nem bitcoin, qualquer coisa quebra muita gente, mas dessa vez eu vou gostar, pq vai lascar aquele tipo de administrador que se fosse por ele só tinha ele na empresa
Lucas Montano, Que diacho de música é essa ?
As placas são vendidas do próprio US, um dos grandes fornecedores de placas nvidia para a China, placas q serão refurbished pelos chineses, é a Tesla!
a chance deles terem desenvolvido os próprios chips ao invés de estar usando as H100 é muito maior do q eles estarem usando as placas da NVIDIA, a galera subestima demais os chineses, eles tao muito mais na nossa frente do q a gente imagina...
Comentei antes do final do video, mas mantenho a posição, logo eles lançam a própria gpu pra IA
Não desenvolveram. Nem as grandes americanas conseguem competir com a NVidia.
A China não faz processador bom. Os americanos nunca deixaram as empresas deles construírem lá pra evitar cópias como fizeram com celulares e outros produtos.
@@brunogoncalves3551 e o modelo é opensource, logo é possível alguém replicar, provar se é verdade ou não
nah
Não pergunte ao DeepSeek da China: O que foi o massacre na praça da paz celestial de 1989?
Tente fazer o chat gpt falar pra vc sobre David Faber... entre outras coisas...
Dica legal: O DeepSeek retorna mas depois do retorno ele "corta" ou seja a resposta ta lá, e no open source tu pega sem esse corte.
Porém o ChatGPT é treinado já com os cortes dele, e ele força pra dizer que não tem.
Já o DeepSeek se tu conversar sobre essa censura ele até explica dela pra vc.
Mas a gente por algum motivo é fissurado nisso em relação a china, e passa despercebido esses detalhes. rs
A era dos robôs dominando o mundo esta mais proxima do eu imaginava.
O principal fator da qualidade desse modelo não é nem o tamanho do modelo nem o treinamento, mas sim, o preparo dos dados. Quem trabalha com dados sabe que investir em qualidade de dados vale muito mais a pena que ficar horas fazendo tuning de parâmetros. As estratégias de pré processamento de dados e os dados processados, em si, não foram disponibilizados. Deve ter sido muito custoso tanto o pré processamento quando o reinforcement learning. Por isso eles estão tranquilos em abrir todo o modelo. Também por isso, é difícil imaginar que consigamos fazer algo parecido com infra estrutura nacional.
na verdade da pra fazer"facilmente" é só o governo querer, isso é uma longa história, mas brasileiros desenvolveram vm's no fim dos anos 80 em unix...
mas estamos no brasil, aonde se supervaloriza tudo o que é de fora não é mesmo ?
E fora que eles tem uma vantagem de ter um número colossal de dados da Internet chinesa em suas mãos. Isso dá possibilidade deles treinarem o modelo com muito mais dados únicos
Uma dúvida… esse rebuliço todo por algo que é open source…
Na pior das hipóteses open ai e cia vao fazer um “copia mas nao faz igual” e lançar o proprio modelo a la deepseek mas com a bandeirinha do trump.
Outra parada que embaça tudo é o modelo que é citado, parece que é o Deepsek R1 que é o fodão, porém, eles tem várias versões do negócio. No doc que tu abriu tem falando do V3.
Quão barato fica produzir algo através de espionagem?
A musica de fundo, achei que era Castlevania. ^~^
🥔🥔🥔 vs 🍓🍓🍓
Se Deus quiser daqui uns dias estaremos programando drones pra limpar campos de batalha 🙏
Agradeça os yankes....
A Fundação Geolíngua está à procura de 2 atores para representar 1 Advogado e 1 Jornalista, a sério! - É uma espécie de AA (Advogado Artificial) e JA (Jornalista Artificial). - Para saber mais, entre em contacto.
Essa declaração desse Alexander esbarra na publicação do Paper que eles fizeram em dezembro, dizendo como fizeram o treinamento usando menos placas da NVidia e, na disponibilidade Opensource do DeepSeek. Qualquer um com 6 milhões de dólares pode replicar o que fizeram. Outros especialistas da área que leram o Paper dizem que acreditam no "milagre" da DeepSeek. Eles adotaram uma outra abordagem.
A questão é que você consegue rodar isso em qualquer computador.
Então se o chip foi Nvidia ou não, eles demonstraram que roda em qualquer chip com eficiência.
Existe o rumor que eles estao usando GPU Huawei.
e se eles apenas locaram a cloud e treinaram?
já me conformei que não vou me aposentar não pelo estado, quero ser capaz de realizar meu trabalho até o final da minha vida, mas claro quando for mais velho quero trabalhar em projetos só por hobby e já estar muito bem financeiramente.
Não são 500 mi, são 500 bilhões!
"Dev" mas ainda não sabe o que Open Source realmente significa pra humanidade. Aposto que é usuário Windows ou pior, Mac. Compra Nvidia e se acha esperto enquanto o Software ativo mais valioso do mundo tbm é um Open Source. Depois não sabe pq a AI vai tirar o emprego dessas pessoas.
No caso você manda seus dados pra os EUA ou pra china, ou só a china rouba os dados mesmo?
DeepSeek e open source. Só baixar e rodar no seu cluster. Ninguém terá acesso aos dados
@@eduardomessiasdemorais7276 Eu sei man, é que ele fala de coleta de dados rsrs
Que som é esse de Senhor do Aneis de fundo kkk ?
H800 é a h100 nerfada feita pra ser exportada pra china por causa das sanções
Compra açao mesmo ... mundo 100% instável e ação é loteria ... Basta dar all in em renda fixa
Eu li num forum na deepweb que a aplicação vai rastrear dados pessoais dos clientes sem a sua intençãoe vender no mercado ..
Usando aqui Vue, Kotlin, Spring e agora o DeepSeek pra completar o combo, e com nenhuma saudade de voltar pra mão dessas big techs.
baita vídeo!!! mas as músicas de fundo não ficaram legais :/
Será que vai ter IA soldadora ?
Caraca, o editou amassou nessa trilha sonora, boa d+ ❤
Aliás, alguém sabe que música é essa?
Me lembra Zelda.
acho que eles já estão usando GPU Huawei
Seria o Deepseek IA o Doom das IAs? Hoje é o MacMini, amanhã é uma geladeira... o futuro é imprevisível hahahaha
Aí você baixa IA local de todas as IAs no mercado e cria outra I.A kkkk
IIRC, os cara tinham uma empresa de mining/cripto e abriram essa branch de IA so pra utilizar os recursos que ficavam ociosos de tempos em tempos
3:11 para aqueles que não são do RS, vocês também falam "afuzel"?
Nunca tinha ouvido falar dessa expressão. 😂
Lucas Montano, sua postura é ruim assim mesmo ou vc tem um corpo tão forte que te deixa inclinado pra frente?
Tem que entender que o CUSTO de uma IA sempre é relacionado ao TEMPO de GPU de treinamento, e também o custo computacional de INFERÊNCIA. Custo de máquina, GPU, energia elétrica e espaço físico (aluguel de imóvel) nunca entra nessa conta. Por isso que a OpenIA tomou essa rasteira toda. De onde vem as GPUs não interessa muito.
Você acha que a AI vai tirar os empregos das pessoas?
Uma AI acabou de tirar o emprego de outra! I quit!
Essa musica ta parecendo aqueles videos motivacionais que o chines ta fala algo heroico
Um tapa na cara na arrogância do governo norte-americano 😂😂😂