Diferença entre usar apenas colchetes ou usar loc para filtrar colunas no Pandas? | Dica de Pandas

Поделиться
HTML-код
  • Опубликовано: 10 дек 2024
  • As dicas de pandas estão de volta! Nesse vídeo, a Kizzy explora operações com colunas do Pandas - tópico muito recorrente nos comentários do canal. Enquanto trabalhamos com dados no Pandas, executamos uma vasta gama de operações nos dados para obtê-los na forma desejada. Uma dessas operações pode ser a seleção de linhas e colunas em um DataFrame do Pandas.
    Selecionar linhas e colunas usando o Pandas é importante em diversas atividades dentro do trabalho de um analista de dados ou cientista de dados. Dentre elas, citamos:
    - Exploração de Dados: tarefa crucial para entender a estrutura dos dados, identificar padrões, detectar valores ausentes e obter insights iniciais.
    - Preparação de Dados: Ao selecionar as colunas relevantes, você pode criar subconjuntos focados de dados que são mais relevantes para a tarefa em questão. Além disso, Você pode filtrar, substituir, renomear, agregar e aplicar funções específicas às colunas escolhidas, tornando os dados mais preparados para análise. Isso ajuda a reduzir o ruído e melhorar a qualidade dos resultados.
    - Análise Específica: Dependendo das perguntas que você está tentando responder, pode ser necessário focar em um subconjunto específico de dados. Selecionar apenas as colunas relevantes ajuda a evitar a sobrecarga de informações e a concentrar-se nas variáveis que importam para sua análise.
    - Visualização: Ao selecionar as colunas de interesse, você pode criar visualizações mais claras e significativas dos dados. Isso permite que você comunique suas descobertas de maneira mais eficaz.
    - Modelagem de Dados: Ao criar modelos de machine learning, é importante escolher as variáveis (colunas) relevantes para a previsão. A seleção cuidadosa das colunas pode melhorar a precisão e a generalização do modelo, além de reduzir a dimensionalidade desnecessária.
    Links úteis:
    📌 Código do vídeo: github.com/pro...
    📌 Site oficial do Pandas: pandas.pydata....
    Em programação de computadores, pandas é uma biblioteca de software criada para a linguagem Python para manipulação e análise de dados. Em particular, oferece estruturas e operações para manipular tabelas numéricas e séries temporais. É software livre sob a licença BSD.[2] O nome é derivado do termo inglês "panel data"(dados em painel), um termo usado em estatística e econometria para conjunto de dados que incluem várias unidades amostrais (indivíduos, empresas, etc) acompanhadas ao longo do tempo. Fonte: Wikipedia
    #DicaPandas #Python
    ▶️ Assista também:
    - CONVERTENDO uma coluna de um DataFrame do Pandas | Dica de Pandas 01: • CONVERTENDO uma coluna...
    - MODIFICANDO o tamanho das COLUNAS de um DataFrame | Dica de Pandas 02: • MODIFICANDO o tamanho ...
    - ORDENEI o resultado do DataFrame DESCRIBE | Dica de Pandas 03: • ORDENEI o resultado do...
    - Método que VERIFICA se dois conjuntos de dados SÃO IGUAIS | DICA DE PANDAS 04: • Método que VERIFICA se...
    - VARIÁVEIS CATEGÓRICAS no Pandas,, dataset GRANDE, dados AUSENTES, bins | Dica de Pandas 06: • VARIÁVEIS CATEGÓRICAS ...
    - LENDO arquivo Zip SEM descompactar + Pandas Backend para Gráficos Interativos | Dica de Pandas 08: • LENDO arquivo Zip SEM ...
    - Particionando DADOS em arquivos CSV menores + Tempo de Execução no Jupyter Notebook | Dica Pandas 09: • Particionando DADOS em...
    - As perguntas de Pandas mais populares no StackOverflow + Pare de copiar código! | Dica de Pandas 10: • As perguntas de Pandas...
    - Ordenando VÁRIAVEIS CATEGÓRICAS no Pandas - CategoricalDtype | Dica de Pandas 11: • Ordenando VÁRIAVEIS CA...
    - Como visualizar um Pandas DataFrame com imagens HTML | Dica de Pandas 14: • Como visualizar um Pan...
    📚 Livro para estudar Bancos de Dados - amzn.to/3Hjjusc
    📚 Livros recomendados de Data Science: amzn.to/2XZyxUr
    📚 Livros de Algoritmos e Estruturas de Dados: amzn.to/3d5wK4m
    SetUp - Equipamentos: amzn.to/37Cg3N2
    🟣 Canal na Twitch para lives: / pgdinamica
    🟦 Canal do Telegram para receber todos os vídeos: t.me/pgdinamica
    🥰 Se você gosta do nosso trabalho e acha relevante a nossa atuação no RUclips, considere nos apoiar se tornando membro do canal: www.youtube.co...
    ✉️ E-mails:
    - Propostas comerciais: pgdinamica@brunch.ag
    - Demais assuntos: contato@programacaodinamica.com.br
    👩🏾‍💻👨🏾‍💻 Confira mais conteúdo em nosso blog: / programacaodinamica
    TikTok: @pgdinamica
    📸 Nos siga no Instagram: / pgdinamica
    📸 @kizzy_terra @hallpaz
    🐦 Nos siga no Twitter: / pgdinamica
    🐦 @kizzy_terra @hallpaz
    Curta a Programação Dinâmica no facebook: pgdinamica
    Nosso repositório no Github: github.com/programacaodinamica
    Confira os artigos no Python Café: pythoncafe.com.br

Комментарии •

  • @Pedro_Nora
    @Pedro_Nora Год назад +3

    O tempo passa e a didática, que já era boa, só melhora!!!
    Excelente vídeo!
    #DicaDePandas
    (Show o novo penteado! 👏👏👏)

  • @TopCoisasBR
    @TopCoisasBR 8 месяцев назад

    Eu comprei um curso de ciência de dados na Udemy mas tem coisa que só consigo entender de vdd quando vc explica, didática incrível te amo mestra

  • @alexandreFerreira-fb2gs
    @alexandreFerreira-fb2gs Год назад +1

    #DicaDePandas muito bom relembrar isso, mesmo quem usa diariamente, tem momentos que para de usar... e o q acontece? esquece. Normal. Por isso q é bom ter um local onde vc guarda seus resumos. rsrsrs

    • @pgdinamica
      @pgdinamica  Год назад

      👏🏾👏🏾 valeu alexandre!

  • @williamsilfer7013
    @williamsilfer7013 Год назад

    Tava com uma dúvida parecida hoje, parabens pela didatica

    • @pgdinamica
      @pgdinamica  Год назад

      Muito obrigada! Bom saber que o vídeo ajudou 😉

  • @pereiragalad9951
    @pereiragalad9951 4 месяца назад

    Muito obrigado!

  • @ThirsonMedina-j4c
    @ThirsonMedina-j4c Год назад

    Muito grato!

  • @michellamorim1236
    @michellamorim1236 Год назад

    Bom dia, parabéns pelo canal e obrigado por compartilhar seu conhecimento, sem cobrar!!!!
    Tenho uma dúvida, após agrupar duas ou mais colunas, seja usando o groupby ou o pivotable, como fazer para selecionar ou mostrar o grupo que tenha maior ocorrência, seja numérico ou string?
    Exemplo: Grupo: Editora de livros e colunas: Títulos
    Como selecionar a editora com maior quantidade de títulos?
    Desde já te agradeço.

    • @pgdinamica
      @pgdinamica  Год назад +1

      Ótima pergunta, vale um vídeo 😉

  • @markuscaldeira
    @markuscaldeira Год назад

    Obrigado

  • @lamermista
    @lamermista Год назад

    #dicadepandas amo todos os seus vídeos

  • @luqueeeta
    @luqueeeta Год назад

    por favor pele pro hallison fazer os videos de arvore B e arvore rubro negra 🙏🙏😭😭 nunca te pedi nada hoje tem criança chorando

    • @pgdinamica
      @pgdinamica  Год назад +1

      Serve live?

    • @luqueeeta
      @luqueeeta Год назад

      @@pgdinamica o que for ajuda kkkkkk

  • @NeilJacintoMartinsAdolfo
    @NeilJacintoMartinsAdolfo 7 месяцев назад

    Boa tarde
    Eu quero unir um conjunto de linhas para formar em uma unica.
    Exemplo:
    codigo nome estado qtd_filhos cidade
    CA01 Laura
    CA01 solteira
    CA01 Lisboa
    CA01 3
    CA02 Rosa
    CA02 casada
    CA02 Maputo
    CA02 1
    Quero seja assim o resultado:
    CA01 Laura Solteira 3 Lisboa
    CA02 Rosa Casada 1 Maputo