Faz um ano que to usando o pandas e sempre que tenho dúvidas venho no seu canal, seu conteúdo me ajuda muito cara, valeu por ter essa calma e didática na hora de explicar.
Excelente aula, estava com problema em separar o "R$" do valor de uma coluna e com essa fórmula consegui resolver para depois transformar essa coluna em float Antes em uma coluna: base["Preço por unidade"] = "R$29.90" Depois base["Preço por unidade"] = base["Preço por unidade"].str.split("$",expand=True)[1] Logo em seguido já consegui transformar em float base["Preço por unidade"].astype(float)
Mano, falei hj nos comentários de um outro video que precisava dessa função. Precisava demais. Muito obrigado por me ajudar mais uma vez. Deus te abençoe muito camarada.
Muito bom seus vídeos!!! Estou aprendendo a mexer agora com base de dados e queria saber se consigo separar apenas as 8 primeiras letras de uma string, é como se fosse um ID porém está junto com um texto.
eu consigo fazer isso utilizando posições do texto? Estou com txt que tem mais de 1milhao de linha e preciso tratar linhas a linha para um dataframe como fazer isso mais rapido?
Parabéns pelo vídeo! Excelente. Poderia me tirar uma dúvida, caso meu delimitador seja espaços em diferentes tamanhos, como faço? Existe uma forma de englobar no split todos os espaços?
Como eu separaria essa coluna em duas? Uma com os Estados e outra com os valores? O do vídeo não funcionou, me responde por favor :(. 1 Centro Oeste 4 2 Distrito Federal 1 3 Goiás 1 4 Mato Grosso 1 5 Mato Grosso do Sul 1
Como eu faço para fazer essa delimitação com mais de um delimitador? Digamos que eu queira delimitar as colunas por "," e por "t", como eu poderia tá fazendo isso da melhor forma?
Excelente vídeo, era o que eu estava procurando há dias. Sou iniciante em Py. Ao separar por split, tem como deixar em linhas, ao invés de colunas? Tipo: Ao invés de novas colunas, criar novas linhas?
Dá pra fazer por contagem de letra. Se quiser incluir nisso a sequência, aí tem que pensar numa lógica maior. Só a contagem de letras em comum (em porcentagem) te atende? Pq aí palavras diferentes mas com o mesmo tamanho e letras dariam 100%. Abs
Vídeo maravilhoso! To usando as dicas do video Professor, porem não to conseguindo separar os dados quando o mesmo se inicia com um caractere e fecha a string com a mesma. (aqui é como vai ficar na planilha do excel, para depois fazer o tratamento de dados com split) ws=(worksheet) (testando com os caracteres "|" e " " (espaços em branco)) ws['A1'].value = "|Nomes| Nome_meio|" ws['A2'].value = "|Larissa| Queiroz|" ws['A3'].value = "| Ana| Rosa |" ws['A4'].value = "| Rosemeire|Elaine|" ws['A5'].value = "|Erika| Margarida|" (aqui começa o problema) EX: df[['Nome', 'Sobrenome']] = df['|Nomes| Nome_meio|'].str.split('|', expand=True) Quando executo o código ele diz: ValueError: Columns must be same length as key ai eu acrescento o numero de colunas que ele permite que é 1, porém o numero de colunas que eu quero é 2 ('Nome', 'Sobrenome') df[['Nome', 'Sobrenome']] = df['|Nomes| Nome_meio|'].str.split('|', n=1 , expand=True) Quando executo o código: Nome Sobrenome Larissa| Queiroz| Ana| Rosa | Rosemeire| Elaine| Erika| Margarida| Não separa entre as duas colunas, e não retira os caracteres. Basicamente ele separa os títulos da coluna e empurra o conteúdo da coluna 1 para a coluna 2 Como eu gostaria que o código ficasse: Nome Sobrenome Larissa Queiroz Ana Rosa Rosemeire Elaine Erika Margarida Desde já agradeço a ajuda professor!
Obrigado!
Muito bom!!!
Excelente
Caracas, salvou meu sono! Excelente. Parabéns!
Esses vídeos curtinhos e bem explicados são muito bons
Exatamente o que eu procurava
Salvou muito! Deus abençoe kk
Muito obrigado!, saludos desde argentina!
Faz um ano que to usando o pandas e sempre que tenho dúvidas venho no seu canal, seu conteúdo me ajuda muito cara, valeu por ter essa calma e didática na hora de explicar.
Objetivo, top demais.
Me ajudou bastante !
Fico feliz!
Excelente aula, estava com problema em separar o "R$" do valor de uma coluna e com essa fórmula consegui resolver para depois transformar essa coluna em float
Antes em uma coluna:
base["Preço por unidade"] = "R$29.90"
Depois
base["Preço por unidade"] = base["Preço por unidade"].str.split("$",expand=True)[1]
Logo em seguido já consegui transformar em float
base["Preço por unidade"].astype(float)
Boa!!!!
Sua dica foi importantíssima, Gratidão!!!!
Muito bom! Me ajudou muito! Obrigado por compartilhar.
Muito bom. Parabéns!
Mano, falei hj nos comentários de um outro video que precisava dessa função. Precisava demais. Muito obrigado por me ajudar mais uma vez. Deus te abençoe muito camarada.
Tmj Pedro 👊
Precisando é só enviar nos comentários
E quando tem por exemplo Belo Horizonte, MG/ Brasil, como faria para separar por 'virgula' e 'traço'?
Separa um depois o outro
@@ProgramePython Fazendo duas variáveis?
Estou com esse probelma:
September 25, 2021
Tem como fazer o split usando 2 ou mais separadores?
Muito bom seus vídeos!!!
Estou aprendendo a mexer agora com base de dados e queria saber se consigo separar apenas as 8 primeiras letras de uma string, é como se fosse um ID porém está junto com um texto.
Obrigado!! Sim! df['col1'].str[:8]
Tenho uma dúvida: Numa coluna de CPF ,em um Dataframe, preciso formatar os dados com 11dígitos, como fazer?
Obrigado! Você pode usar o .str.replace pra retirar os - e .
@@ProgramePython .Gratidão, o detalhe também é que os cpf`s ainda faltam dígitos, devido os zeros na frente do número!!!
Formata eles como string ao invés de integer
eu consigo fazer isso utilizando posições do texto? Estou com txt que tem mais de 1milhao de linha e preciso tratar linhas a linha para um dataframe como fazer isso mais rapido?
isso funciona com letras e numeros exemplo "DAL234" ou "GLO123"?
Não da forma que mostrei.
Tenta isso: df['col'].str.extract('([A-Za-z]+)(\d+\.?\d*)([A-Za-z]*)', expand = True)
Parabéns pelo vídeo! Excelente. Poderia me tirar uma dúvida, caso meu delimitador seja espaços em diferentes tamanhos, como faço? Existe uma forma de englobar no split todos os espaços?
Nesse caso vc pode separar por apenas um espaço e depois utilizar a função .str.strip(' ') para limpar os espaços em excesso.
Como eu separaria essa coluna em duas? Uma com os Estados e outra com os valores? O do vídeo não funcionou, me responde por favor :(.
1 Centro Oeste 4
2 Distrito Federal 1
3 Goiás 1
4 Mato Grosso 1
5 Mato Grosso do Sul 1
Tenta assim: .str.rsplit(' ', 1)
Como eu faço para fazer essa delimitação com mais de um delimitador? Digamos que eu queira delimitar as colunas por "," e por "t", como eu poderia tá fazendo isso da melhor forma?
TypeError: 'expand' is an invalid keyword argument for split()
poderia me ajuda?
Olá! Vou precisar de mais informações. Manda o código q vc usou, por favor.
@@ProgramePython vendas_tesouro[['Tipo Titulo', 'Vencimento do Titulo', 'Data Venda', 'PU']] = vendas_tesouro['index'].apply(lambda x: x[0].split(';', expand=True))
eu estou usando o colab
the blu, o problema é pela ausência do .str . Assiste a partir do 0:43, nesse ponto explico o uso do .str antes do .split .
Abraços!
@@ProgramePython funcionou. Obrigado pela ajuda! seu canal ta me salvando.
Tmj! Se precisar manda aí nos comentários
Excelente vídeo, era o que eu estava procurando há dias. Sou iniciante em Py. Ao separar por split, tem como deixar em linhas, ao invés de colunas? Tipo: Ao invés de novas colunas, criar novas linhas?
Cara, queria fazer um apelo.. rsrs
Poderia disponibilizar algo mostrando como comparar a similaridade de strings em 2 colunas no mesmo Dataframe?
Fala Jefferson!
O que quer dizer com similaridade? Saber quais são diferentes?
Abs
@@ProgramePython Sei que é meio complexo...
Mas seria tipo:
Jefferson | Jefferson = 100%
Jefferson | Jeferson = 88 %
Dá pra fazer por contagem de letra. Se quiser incluir nisso a sequência, aí tem que pensar numa lógica maior. Só a contagem de letras em comum (em porcentagem) te atende?
Pq aí palavras diferentes mas com o mesmo tamanho e letras dariam 100%.
Abs
Olá, o meu também deu erro. Ele não localiza a coluna, KeyError: 'Data'.
Código: dados['Data'].str.split('/')
Olá Louise, verifica se o nome da coluna que você quer dividir é 'Data' mesmo.
Depois me conta se deu certo!
Abraços
Vídeo maravilhoso!
To usando as dicas do video Professor, porem não to conseguindo separar os dados quando o mesmo se inicia com um caractere e fecha a string com a mesma.
(aqui é como vai ficar na planilha do excel, para depois fazer o tratamento de dados com split) ws=(worksheet)
(testando com os caracteres "|" e " " (espaços em branco))
ws['A1'].value = "|Nomes| Nome_meio|"
ws['A2'].value = "|Larissa| Queiroz|"
ws['A3'].value = "| Ana| Rosa |"
ws['A4'].value = "| Rosemeire|Elaine|"
ws['A5'].value = "|Erika| Margarida|"
(aqui começa o problema) EX:
df[['Nome', 'Sobrenome']] = df['|Nomes| Nome_meio|'].str.split('|', expand=True)
Quando executo o código ele diz: ValueError: Columns must be same length as key
ai eu acrescento o numero de colunas que ele permite que é 1, porém o numero de colunas que eu quero é 2 ('Nome', 'Sobrenome')
df[['Nome', 'Sobrenome']] = df['|Nomes| Nome_meio|'].str.split('|', n=1 , expand=True)
Quando executo o código:
Nome Sobrenome
Larissa| Queiroz|
Ana| Rosa |
Rosemeire| Elaine|
Erika| Margarida|
Não separa entre as duas colunas, e não retira os caracteres. Basicamente ele separa os títulos da coluna e empurra o conteúdo da coluna 1 para a coluna 2
Como eu gostaria que o código ficasse:
Nome Sobrenome
Larissa Queiroz
Ana Rosa
Rosemeire Elaine
Erika Margarida
Desde já agradeço a ajuda professor!