URL: https://www.overclockers.at/coding-stuff/python-pandas-data-cleaning_263816/page_1 - zur Vollversion wechseln!
Vielleicht weiß hier jemand weiter, ich habe gerade einen Datentypen-Fehler aufgerissen, den ich bis jetzt so noch nicht hatte.
Möchte objects zu int/string/datetime konvertieren/bool und das möglichst automatisiert. Ich habe mir überlegt hier mit Loops zu arbeiten. Und idealerweise gleich NaN's und Null zu behandeln.
Die Daten sind öffentlich erhältlich.
Spricht was dagegen folgenden Funktionen zu arbeiten?
df['SPALTE'].astype(str).replace('nan', '')
# df['firstflightdate'] = pd.to_datetime(df['SPALTE'], errors='coerce')
Ansonsten wäre auch cool gleich via read_csv die richtigen dtypes anzugeben, aber das funktioniert nicht, es bleibt trotzdem object
Code:# Define data types for specific columns dtype_dict = { 'column1': 'str', 'column2': 'str', ... } # Load CSV File with specified data types df = pd.read_csv('aircraftDatabase-2024-04.csv', dtype=dtype_dict, sep=',') df.head() df.info()
overclockers.at v4.thecommunity
© all rights reserved by overclockers.at 2000-2025