Como fazer PROCV - e outros Joins - no Python
HTML-код
- Опубликовано: 5 янв 2025
- Você usava Excel e está migrando para o Python? Ou então usava
Notebook utilizado no vídeo: github.com/yuk...
Outros posts sobre join no Python:
estatsite.com.b...
estatsite.com.b...
Como fazer Left Join no SQL: • Left Join, o PROCV do SQL
Qualquer dúvida, fique à vontade para comentar ou entrar em contato por qualquer outro meio.
E se quiser saber mais de ciência de dados, machine learning, Python, R, SAS e SQL, é só acessar WWW.ESTATSITE.COM.BR.
Ouça também meu podcast FUTURISTANDO. Toda segunda-feira, um giro de notícias sobre as novidades no mundo da tecnologia. Disponível no Spotify, Deezer, Apple Podcasts, Google Podcasts e demais agregadores.
Siga @UniDosDados no Twitter!
Ganhou um inscrito e soquei o like a vontade. Pratico, objetivo. Mandou bem garoto!!
Obrigado, Aldemir!!
Noss muito simples, obrigado por ensinar
otimo
No caso, no excel não necessiamente a fórmula precisa de um dado igual. Eu posso apontar onde ela vai preencher a célula. Como eu faço isso?
Show. UF: Unidade Federativa
como que eu faço pra trazer esse zero ai da coluna, tipo que quero fazer o procv pra saber a posição dele na tabela, se ta na linha 1, 2, 3 assim por diante
Excelente
Muito objetivo, parabens!!
As colunas tem que ter o mesmo nome?
Muito bom!!
Professor, sensacional! Muito obrigado irá me ajudar bastante, já me inscrevi no canal.
Obrigado pela força🙏
Que aulaaaaaaaaaa!!
Obrigado😊
Ótima aula! Muito bom !!
ganhou um inscrito!!!
Valeu Sergio!!!😊
Cara aqui deu erro, não funcionou:
ValueError: The column label 'ID' is not unique.
Boa tarde Professor, muito boa aula, me ocorreu uma dúvida no seguinte caso. Se ao invés de o campo ID for um campo com Nomes em duas planilhas e eu queira ver a correspondência desses nomes nas duas(se um nome existe nas duas) porém os nome não estão necessariamente completos, ex: Pedro Dias de Melo Prado e Pedro Melo Prado, são a mesma pessoa porém os nomes estão diferentes, o Python pega isso como uma correspondência ? Se não, há uma forma de fazer essa correspondência ?
Fala, João! Obrigado pelo feedback. Sobre a questão, não tendo correspondência exata é altamente recomendável não faz o join, a chance de vc trazer a informação de outra pessoa é altíssima. Inclusive, do jeito que vc ta falando, é certo que viria informação errada. Sempre tente fazer por um campo ID, seja cpf ou codigo da empresa. Respondendo mais precisamente sua pergunta, o Python nao entenderia. Precisaria estar exatamente igual o nome.
@@universidade-dos-dados ok obrigado !
pow muito bom
nossa assisti algumas vezes seu vídeo, é excelente parabéns.
Estou tentando resolver um problema com o merge, por isso fiquei vendo o vídeo se fiz algo errado.
o meu df1 tem um total de 11319 rows × 29 columns e o df2 tem 11345 rows × 5 columns.
Quando faço o merge = df1.merge(df2, on='CycleName', how='left')
ele me traz 2017478 rows × 36 columns, com o left não era só para manter as informações do df1 e adicionar o restantes?
Bom desde já, um muito obrigado e você fez um excelente trabalho ^_^
Qual é a diferença do R pro Python?
O R é bem específico para estatística. Você vai ver que a maioria dos usuários de R são analistas ou cientistas de dados. Embora em Python também tenha muito dessa galera, há desenvolvedores e outros profissionais usando. A linguagem também acaba sendo mais parecida com outras. Por conta disso, tem um hype maior, sendo que em alguns rankings até já aparece como uma das 3 linguagens de programação mais utilizadas. As diferenças são bem específicas e há inúmeras listas. Minha recomendação é que vc escolha a que mais lhe agrada, ou vá em Python porque é mais utilizada.
@@universidade-dos-dados obrigado! Meus professores usam apenas a linguagem R, mas eu tenho a sensação que no mercado de trabalho Python é mais empregado.
E se tem uma planilha que nela há o id, nome, idade, tarefa 1, tarefa 2, tarefa 3 .. tarefa n. Outra planilha há duas colunas uma de tarefas e nessa coluna há escrito tarefa 1, tarefa 2, tarefa 3 ... tarefa n e outra de valores, cada tarefa tem um valor nela. Quero obter o valor daquela tarefa que está indicado na outra planilha.
Seria assim na primeira planilha
id Nome Tarefa 1 Tarefa 2 Tarefa 3
1 José x x
2 João x x
3 Pedro x x x
Na segunda planilha seria
Tarefas Valores
Tarefa 1 10
Tarefa 2 5
Tarefa 3 8
O objetivo é criar
id Nome Tarefa 1 Tarefa 2 Tarefa 3 ValorTarefa1 ValorTarefa2 ValorTarefa3
1 José x x 10 8
2 João x x 10 5
3 Pedro x x x 10 5 8
No excel ficaria assim para a coluna ValorTarefa1
=se(Tarefa 1 indice da linha="x"; procv(Planilha2 Tarefas:Valores;2;FALSO);"")
Nos exemplos bem explicados no vídeo todos tinham uma coluna com valores únicos, esse exemplo acima é possível fazer no python? Se sim, como? Obrigado pela atenção. Gostaria de automatizar isso, se tiver tarefas de 1 a 10 é um trabalho bem demorado e enfadonho.