Como dividir COLUNAS por DELIMITADOR - Python PANDAS

Поделиться
HTML-код
  • Опубликовано: 2 дек 2024

Комментарии • 51

  • @feliperoque18
    @feliperoque18 Год назад +1

    Obrigado!

  • @alissonoliveira371
    @alissonoliveira371 3 месяца назад

    Muito bom!!!

  • @guilhermemastelini6487
    @guilhermemastelini6487 2 года назад +1

    Excelente

  • @vectorup
    @vectorup Год назад +1

    Caracas, salvou meu sono! Excelente. Parabéns!

  • @eliadesquer1755
    @eliadesquer1755 7 месяцев назад

    Esses vídeos curtinhos e bem explicados são muito bons

  • @rogel2700
    @rogel2700 11 месяцев назад

    Exatamente o que eu procurava

  • @viniciush.4740
    @viniciush.4740 Год назад +1

    Salvou muito! Deus abençoe kk

  • @markpocos12
    @markpocos12 2 года назад +1

    Muito obrigado!, saludos desde argentina!

  • @PietroTheBestBR
    @PietroTheBestBR Год назад +2

    Faz um ano que to usando o pandas e sempre que tenho dúvidas venho no seu canal, seu conteúdo me ajuda muito cara, valeu por ter essa calma e didática na hora de explicar.

  • @brunalopes9793
    @brunalopes9793 Год назад +1

    Objetivo, top demais.

  • @andersonbezerra5851
    @andersonbezerra5851 3 года назад +1

    Me ajudou bastante !

  • @dutra6685
    @dutra6685 2 года назад +1

    Excelente aula, estava com problema em separar o "R$" do valor de uma coluna e com essa fórmula consegui resolver para depois transformar essa coluna em float
    Antes em uma coluna:
    base["Preço por unidade"] = "R$29.90"
    Depois
    base["Preço por unidade"] = base["Preço por unidade"].str.split("$",expand=True)[1]
    Logo em seguido já consegui transformar em float
    base["Preço por unidade"].astype(float)

  • @cirleigoes3goes440
    @cirleigoes3goes440 2 года назад +1

    Sua dica foi importantíssima, Gratidão!!!!

  • @evertoncastro8339
    @evertoncastro8339 2 года назад +2

    Muito bom! Me ajudou muito! Obrigado por compartilhar.

  • @joaovictors.m5089
    @joaovictors.m5089 3 года назад +1

    Muito bom. Parabéns!

  • @pedrob.popovitch8452
    @pedrob.popovitch8452 3 года назад +4

    Mano, falei hj nos comentários de um outro video que precisava dessa função. Precisava demais. Muito obrigado por me ajudar mais uma vez. Deus te abençoe muito camarada.

    • @ProgramePython
      @ProgramePython  3 года назад +2

      Tmj Pedro 👊
      Precisando é só enviar nos comentários

  • @helitonribeiroferreira6948
    @helitonribeiroferreira6948 2 года назад +1

    E quando tem por exemplo Belo Horizonte, MG/ Brasil, como faria para separar por 'virgula' e 'traço'?

  • @thiagosantana_oficial
    @thiagosantana_oficial 5 месяцев назад

    Estou com esse probelma:
    September 25, 2021
    Tem como fazer o split usando 2 ou mais separadores?

  • @JorgeLuiz-rp1td
    @JorgeLuiz-rp1td 3 года назад +1

    Muito bom seus vídeos!!!
    Estou aprendendo a mexer agora com base de dados e queria saber se consigo separar apenas as 8 primeiras letras de uma string, é como se fosse um ID porém está junto com um texto.

  • @cirleigoes3goes440
    @cirleigoes3goes440 2 года назад +1

    Tenho uma dúvida: Numa coluna de CPF ,em um Dataframe, preciso formatar os dados com 11dígitos, como fazer?

    • @ProgramePython
      @ProgramePython  2 года назад

      Obrigado! Você pode usar o .str.replace pra retirar os - e .

    • @cirleigoes3goes440
      @cirleigoes3goes440 2 года назад

      @@ProgramePython .Gratidão, o detalhe também é que os cpf`s ainda faltam dígitos, devido os zeros na frente do número!!!

    • @ProgramePython
      @ProgramePython  2 года назад

      Formata eles como string ao invés de integer

  • @PedroHenrique-ct8yl
    @PedroHenrique-ct8yl 2 года назад

    eu consigo fazer isso utilizando posições do texto? Estou com txt que tem mais de 1milhao de linha e preciso tratar linhas a linha para um dataframe como fazer isso mais rapido?

  • @noobdaaviacao
    @noobdaaviacao 3 года назад +1

    isso funciona com letras e numeros exemplo "DAL234" ou "GLO123"?

    • @ProgramePython
      @ProgramePython  3 года назад +1

      Não da forma que mostrei.
      Tenta isso: df['col'].str.extract('([A-Za-z]+)(\d+\.?\d*)([A-Za-z]*)', expand = True)

  • @diegoalmeida6255
    @diegoalmeida6255 2 года назад +1

    Parabéns pelo vídeo! Excelente. Poderia me tirar uma dúvida, caso meu delimitador seja espaços em diferentes tamanhos, como faço? Existe uma forma de englobar no split todos os espaços?

    • @ProgramePython
      @ProgramePython  2 года назад +1

      Nesse caso vc pode separar por apenas um espaço e depois utilizar a função .str.strip(' ') para limpar os espaços em excesso.

  • @luansousakanavi1192
    @luansousakanavi1192 3 года назад +1

    Como eu separaria essa coluna em duas? Uma com os Estados e outra com os valores? O do vídeo não funcionou, me responde por favor :(.
    1 Centro Oeste 4
    2 Distrito Federal 1
    3 Goiás 1
    4 Mato Grosso 1
    5 Mato Grosso do Sul 1

  • @MateusSantos-jl5bo
    @MateusSantos-jl5bo Год назад

    Como eu faço para fazer essa delimitação com mais de um delimitador? Digamos que eu queira delimitar as colunas por "," e por "t", como eu poderia tá fazendo isso da melhor forma?

  • @theblu1
    @theblu1 3 года назад +1

    TypeError: 'expand' is an invalid keyword argument for split()
    poderia me ajuda?

    • @ProgramePython
      @ProgramePython  3 года назад

      Olá! Vou precisar de mais informações. Manda o código q vc usou, por favor.

    • @theblu1
      @theblu1 3 года назад +1

      @@ProgramePython vendas_tesouro[['Tipo Titulo', 'Vencimento do Titulo', 'Data Venda', 'PU']] = vendas_tesouro['index'].apply(lambda x: x[0].split(';', expand=True))
      eu estou usando o colab

    • @ProgramePython
      @ProgramePython  3 года назад

      the blu, o problema é pela ausência do .str . Assiste a partir do 0:43, nesse ponto explico o uso do .str antes do .split .
      Abraços!

    • @theblu1
      @theblu1 3 года назад +1

      @@ProgramePython funcionou. Obrigado pela ajuda! seu canal ta me salvando.

    • @ProgramePython
      @ProgramePython  3 года назад

      Tmj! Se precisar manda aí nos comentários

  • @thiagoviana6597
    @thiagoviana6597 2 года назад

    Excelente vídeo, era o que eu estava procurando há dias. Sou iniciante em Py. Ao separar por split, tem como deixar em linhas, ao invés de colunas? Tipo: Ao invés de novas colunas, criar novas linhas?

  • @jeffersonlima5037
    @jeffersonlima5037 3 года назад +1

    Cara, queria fazer um apelo.. rsrs
    Poderia disponibilizar algo mostrando como comparar a similaridade de strings em 2 colunas no mesmo Dataframe?

    • @ProgramePython
      @ProgramePython  3 года назад +1

      Fala Jefferson!
      O que quer dizer com similaridade? Saber quais são diferentes?
      Abs

    • @jeffersonlima5037
      @jeffersonlima5037 3 года назад +1

      @@ProgramePython Sei que é meio complexo...
      Mas seria tipo:
      Jefferson | Jefferson = 100%
      Jefferson | Jeferson = 88 %

    • @ProgramePython
      @ProgramePython  3 года назад

      Dá pra fazer por contagem de letra. Se quiser incluir nisso a sequência, aí tem que pensar numa lógica maior. Só a contagem de letras em comum (em porcentagem) te atende?
      Pq aí palavras diferentes mas com o mesmo tamanho e letras dariam 100%.
      Abs

  • @louises685
    @louises685 3 года назад +1

    Olá, o meu também deu erro. Ele não localiza a coluna, KeyError: 'Data'.
    Código: dados['Data'].str.split('/')

    • @ProgramePython
      @ProgramePython  3 года назад

      Olá Louise, verifica se o nome da coluna que você quer dividir é 'Data' mesmo.
      Depois me conta se deu certo!
      Abraços

  • @reveenbr
    @reveenbr 2 года назад +1

    Vídeo maravilhoso!
    To usando as dicas do video Professor, porem não to conseguindo separar os dados quando o mesmo se inicia com um caractere e fecha a string com a mesma.
    (aqui é como vai ficar na planilha do excel, para depois fazer o tratamento de dados com split) ws=(worksheet)
    (testando com os caracteres "|" e " " (espaços em branco))
    ws['A1'].value = "|Nomes| Nome_meio|"
    ws['A2'].value = "|Larissa| Queiroz|"
    ws['A3'].value = "| Ana| Rosa |"
    ws['A4'].value = "| Rosemeire|Elaine|"
    ws['A5'].value = "|Erika| Margarida|"
    (aqui começa o problema) EX:
    df[['Nome', 'Sobrenome']] = df['|Nomes| Nome_meio|'].str.split('|', expand=True)
    Quando executo o código ele diz: ValueError: Columns must be same length as key
    ai eu acrescento o numero de colunas que ele permite que é 1, porém o numero de colunas que eu quero é 2 ('Nome', 'Sobrenome')
    df[['Nome', 'Sobrenome']] = df['|Nomes| Nome_meio|'].str.split('|', n=1 , expand=True)
    Quando executo o código:
    Nome Sobrenome
    Larissa| Queiroz|
    Ana| Rosa |
    Rosemeire| Elaine|
    Erika| Margarida|
    Não separa entre as duas colunas, e não retira os caracteres. Basicamente ele separa os títulos da coluna e empurra o conteúdo da coluna 1 para a coluna 2
    Como eu gostaria que o código ficasse:
    Nome Sobrenome
    Larissa Queiroz
    Ana Rosa
    Rosemeire Elaine
    Erika Margarida
    Desde já agradeço a ajuda professor!