0
I’m trying to create a function that traverses a dataset and removes characters from strings like ('? *'), and returns the already corrected column within the dataset.
As an example of dataset:
df = pd.DataFrame([[np.nan, 'ds??', 'fgfs', 0],
[3, 'dsda#..*', np.nan, 1],
[np.nan, '1 ??d', np.nan, 5],
[np.nan, 'v2', 0, 4]],
columns=list('ABCD'))
'''
Gostaria de um função que retorna-se as colunas sem os caracteres #?,somente com números e letras
eu preciso de uma função um pouco mais genérica , para o dataset todo tipo , que reconheça a coluna object e trata ela ,estou tentando fazer dessa forma .
def tratar_str2(df):
for col in df.columns:
if df[col].dtype.name == df['object']:
for k , v in enumerate(df['object']):
df[v] = re.sub(r'(?<![a-z])-|-(?![a-z])', '',df[v], flags=re.IGNORECASE)
return df