python, panda's: InvalidIndexError bij het maken van dataframe

stemmen
40

Ik heb het verkennen van de titanic dataset . Ik ben op zoek naar een te creëren dataframedie de leeftijden van de mensen die de Titanic zinken overleefd hebben, en degenen die dat niet deden, in twee afzonderlijke kolommen.

    train = pd.read_csv('train.csv')
    test = pd.read_csv('test.csv')    
    whole = pd.concat([train, test])
    df = pd.DataFrame({'survived': whole['Age'][whole['Survived'] == 1],
                       'died': whole['Age'][whole['Survived'] == 0]})

Maar ik krijg deze fout

pandas.indexes.base.InvalidIndexError: indexeren alleen geldig bij een unieke gewaardeerd Index objecten

Wat doe ik verkeerd?

De vraag is gesteld op 28/05/2017 om 16:53
user
In andere talen...                            


1 antwoorden

stemmen
2

Maak deze verandering in uw code whole = pd.concat([train, test]).reset_index(drop=True)

antwoordde op 28/05/2017 om 17:23
bron van user

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more