tô precisando fazer um projeto de extensão da faculdade de topicos de big data em python e esse video abriu minha mente para o como vou fazer o projeto
não entendi o tratamento do MAY90, é porque esta fora do padrão que é primeira letra maiuscula e demais minusculas? mas como saber isso se o dataframe for mto grande?
df[lst] = df[lst].astype("float") esse nan desse nem a pau nao aponta erro de sintaxe anterior .... dureza porem um desafio mt mt mt empolgante estou amando o que eu escolhi ser ! apaixonada pelo video o cara é so XABLAU DOS DADOS
to com dificuldade nessa mesma linha, é como se houvesse algum caractere que é string e não pode ser convertido em float por algum motivo@@DataMarketing
Nesse case pode realizar algum tipo de consulta, ou teria que lembrar a sintaxe toda na prática? Pq eu até consigo realizar análise ou criar modelos de ML na prática, mas ainda sou muito dependente da documentação então não tenho muita confiança em aplicar pra vagas
Qual a finalidade dessa parte do código ? "df.replace('MAY90', np.nan)" sei que ele está substituindo os valores de "MAY90" por NaN. Mas não localizei nenhum dado com essa informação ("MAY90"), antes da transformação.
enrosquei na mesma coisa, "acho" que pq o mês esta no padrão iniciando em maiculusco e depois minusculo, tipo: May90, eu achei que com o codigo agrupado = df.groupby([Month']).size() agrupado visualizaria mas são muitas informações... não sei como verificar esse tipo de informação num df mto grande
Não estou conseguindo converter a coluna Month para data. fiz o código igualzinho e da esse erro: 'DataFrame' object has no attribute 'Month' Estou usando Jupyter
Opa não sei se você conseguiu arrumar o erro depois de 1 ano né kkkkkk mas eu tive o mesmo erro, quebrei a cabeça pra entender(sou iniciante) e entendi que na tabela ta month com 'm' e não 'Month' com o 'M'. fiz esse codigo aqui, se alguém em 2024 tiver o mesmo erro tente essa solução df.rename(columns={'month': 'Month'}, inplace=True) basicamente aqui eu to procurando pela coluna 'month' e trocando para Month. e LEMBRE-SE de usar o inplace pq ele é o que vai deixar salvo. e aqui é como o cara no vídeo fez, mas para mim funcionou botando dentro de [] como uma lista. Então ve ai se o seu funciona como df.Month ou se df['Month'] df['Month'] = pd.to_datetime(df['Month'].str.upper(), format="%b%y", yearfirst=False) # Defina 'Month' como índice df = df.set_index('Month')
Quer se tornar um analista de dados de sucesso? Conheça a plataforma da Data Marketing: www.datamarketingdigital.com.br 😀
Faz uma serie irmao, com varios projetos, seria otimo para nos que estamos aprendendo.
Ótimo vídeo!! Faça mais, por favor!
Pode deixarrr!!
tô precisando fazer um projeto de extensão da faculdade de topicos de big data em python e esse video abriu minha mente para o como vou fazer o projeto
Opa! Ótimo vídeo, aprendi bastante. Deu pra ter uma idéia do dia a dia de uma Analista e colocar em prática algumas tarefas. Parabéns e obrigado!
Excelente! Faça mais videos assim por favor!!!!
muito show essa didática ,vou até favoritar pra quando passar pra python aqui
Boaaa Alan =D
Esse curso ta muito bom, parabéns
Mais um inscrito, vou estudar, gostei muito das strings. Estou tentando entender...
Parabéns! Vídeo MUITO bom! 👏🏼👏🏼 só uma dica, aumenta um pouco o close no código quando for explicar, ficará melhor pra visualizar.
Muito bom! Sugestão de melhoria: faça vídeos menores.
Excelente vídeo, obrigada por compartilhar!
de nada =D
Uma solução mais enxuta para o tratamento de dados:
df.columns = [str(i).lower() for i in df.columns] #deixando colunas em minúsculo
#substituindo registros inválidos por null
df = df.replace('%', '', regex = True)
df = df.replace(',', '', regex = True)
df = df.replace('-', '', regex = True)
df = df.replace('', np.nan)
df = df.replace('MAY90', np.nan)
df = df.dropna() #excluindo registros inválidos
df.isnull().sum() #verificando se ainda há nulos
#convertendo para float
lst = df.columns[1:]
df[lst] = df[lst].astype('float')
df.dtypes
boa!! sempre vai ter mais de uma forma de chegar no mesmo resultado =)
@@DataMarketingo meu ta indicando erro na linha df = df.replace('%', ' ', regex=true)
Também tô usando google colab
@@lewis_jogaJá passou muito tempo 😅😅...
Mas o erro estava no "true" tem que ser "True"
não entendi o tratamento do MAY90, é porque esta fora do padrão que é primeira letra maiuscula e demais minusculas? mas como saber isso se o dataframe for mto grande?
@@BrunaSantos-yo2ug fiquei na msm dúvida
Sensacional!!!
Muito bom, obrigado por compartilhar
Eu que agradeço
sensacional !!! faz mais.
top de mais , faz um video de portfólio para engenharia de dados ! Prfv
anotado! trazer algo voltado para automatização
Parabéns pelo vídeo. Muito obrigado
df[lst] = df[lst].astype("float")
esse nan desse nem a pau nao aponta erro de sintaxe anterior .... dureza porem um desafio mt mt mt empolgante estou amando o que eu escolhi ser ! apaixonada pelo video o cara é so XABLAU DOS DADOS
Quando ocorrem os problemas e a gente busca entender como resolver é quando mais aprendemos 😉 seja bem vinda
to com dificuldade nessa mesma linha, é como se houvesse algum caractere que é string e não pode ser convertido em float por algum motivo@@DataMarketing
dica... aumentar em 20% a fonte, meu monitor é gigante e a fonte está pequena, da pra ler, mas iria facilitar a visualização
Nesse case pode realizar algum tipo de consulta, ou teria que lembrar a sintaxe toda na prática? Pq eu até consigo realizar análise ou criar modelos de ML na prática, mas ainda sou muito dependente da documentação então não tenho muita confiança em aplicar pra vagas
Muito bom👏
Obrigado🥰
por que o df.info não roda no vscode?
muito bom
Obrigado Diego!
Showww acho que esse video é inédito, parabéns e obrigado. Quanto tempo demorou na prática para fazer esse desafio?
Esse projeto foi algo em torno de 5 horas mas divido em dois dias.
Muito bom!!
Dica: Use zoom em seus códigos. A letra é muito pequena, o que pode desestimular pessoas a assistirem aos seus vídeos.
Mas faltou dar zoom no conteúdo ficou muito difícil visualizar
Brabo meu nobre!
Obrigado Romulo =D
Qual a finalidade dessa parte do código ? "df.replace('MAY90', np.nan)" sei que ele está substituindo os valores de "MAY90" por NaN. Mas não localizei nenhum dado com essa informação ("MAY90"), antes da transformação.
enrosquei na mesma coisa, "acho" que pq o mês esta no padrão iniciando em maiculusco e depois minusculo, tipo: May90, eu achei que com o codigo agrupado = df.groupby([Month']).size()
agrupado visualizaria mas são muitas informações... não sei como verificar esse tipo de informação num df mto grande
Não estou conseguindo converter a coluna Month para data. fiz o código igualzinho e da esse erro:
'DataFrame' object has no attribute 'Month'
Estou usando Jupyter
Opa não sei se você conseguiu arrumar o erro depois de 1 ano né kkkkkk mas eu tive o mesmo erro, quebrei a cabeça pra entender(sou iniciante) e entendi que na tabela ta month com 'm' e não 'Month' com o 'M'.
fiz esse codigo aqui, se alguém em 2024 tiver o mesmo erro tente essa solução
df.rename(columns={'month': 'Month'}, inplace=True)
basicamente aqui eu to procurando pela coluna 'month' e trocando para Month. e LEMBRE-SE de usar o inplace pq ele é o que vai deixar salvo.
e aqui é como o cara no vídeo fez, mas para mim funcionou botando dentro de [] como uma lista. Então ve ai se o seu funciona como df.Month ou se df['Month']
df['Month'] = pd.to_datetime(df['Month'].str.upper(), format="%b%y", yearfirst=False)
# Defina 'Month' como índice
df = df.set_index('Month')
Conteúdo ótimo, mas ficou muito pequeno, ainda mais com fundo branco que pena.